„Microsoft“ daro didelius kalbos statymus naudodama „Windows 8“, „Bing“.

  • Aug 30, 2023

„Microsoft Tellme“ komanda dirba su „Bing“, „Windows Phone“, „Kinect“ / „Xbox“, „Azure“ ir kitomis „Microsoft“. komandos per ateinančius metus pridės naujų į kalbą orientuotų „Microsoft“ ir trečiųjų šalių produktų galimybių.

„Microsoft“ konsoliduotas kalbos technologijų padalinys „Microsoft Tellme“ dirba su daugybe produktų komandų bendrovei, kad kalbos atpažinimas ir supratimas taptų pagrindiniu daugelio naujos kartos „Microsoft“ pasiūlymų komponentu.

„Microsoft“ vadovai viešai demonstravo, kaip „Windows Phone“ šiuo metu gali tvarkyti žodines užklausas. Su „Mango“ „Windows Phones“ palaikys dar daugiau kalbos funkcijų, įskaitant kalba į tekstą ir tekstas į kalbą. O Kinect jutiklis šį rudenį gaus sudėtingesnį balso komandų palaikymą, todėl vartotojai galės naudokite Bing norėdami ieškoti filmų, TV, muzikos ir kito turinio balsu.

Tačiau ateinančiais metais dar daugiau „Microsoft“ produktų ir paslaugų bus traktuojami kaip kalbos atpažinimas / supratimas.

„Windows 7“ šiandien gali atpažinti ribotą sakytinių komandų rinkinį

. Tačiau „Microsoft“ tęs šį darbą su „Windows 8“, sakė Ilja Bukšteynas, Tellme pardavimų ir rinkodaros vyresnysis direktorius. „Windows 8“ ARM ir „Intel“ sistemose galės atpažinti daugybę kalbos komandų, o tai prasminga, nes jos nebus optimizuotos klaviatūros ir pelės įvestims. Kadangi „Windows 8“ yra „pagrįsta HTML“, HMTL5 kalbos žyma gali leisti kūrėjams „Microsoft“ viduje ir už jos ribų kurti „Windows 8“ programas, kurios gali kalbėti, pridūrė Bukshteyn.

„Tellme“ komandai žengiant už kalbos atpažinimo ir pokalbio supratimo, scenarijai tampa dar įdomesni, sakė Bukshteyn. Kai generalinis direktorius Steve'as Ballmeris neseniai paminėjo „Bing“ gebėjimas palaikyti sudėtingas natūralios kalbos užklausų komandas, jis nepaaiškino, kas paskatins tą magiją. Pasirodo, tai „Tellme“ balso technologija, kartu su socialinio grafiko informacija, pateikta per „Windows Live“, ir „Bing“ paieškos funkcija. („Windows Live“ yra socialinių grafikų centras, skirtas „Facebook“, „Twitter“ ir „LinkedIn“, – paaiškino Bukshteyn.)

Rugpjūčio 9 d. Microsoft paskelbė vaizdo klipą, kuriame pabrėžiama, kaip toks pokalbio supratimas galėtų veikti (ir parodė šį klipą SpechTek konferencijos pagrindiniame pranešime Niujorke):

Pavyzdys: tarkime, kad kitą savaitę norite susitikti su draugu Niujorke pavakarieniauti. Galbūt kai tik pora nuo trejų iki penkerių metų (laiko nuoroda pakeista dėl „Microsoft“ prašymo), „Microsoft“ pareigūnai mano, kad galėsite pasakyti savo kompiuteriui „suorganizuokite vakarienę su Džo Manhetene ketvirtadienį“, o Tellme atpažins užklausą, nurodys jūsų „Facebook“ ar „LinkedIn“ socialinio grafiko informaciją. atraskite, su kuriuo „Joe“ greičiausiai norėsite susitikti, palyginkite savo kalendorius ir naudokite „Bing“, kad ieškotumėte restoranų, kuriuose abu pažymėjote „Patinka“ Facebook.

„Tellme“ tinklaraščio įraše rugpjūčio 9 d. pateikiamas „Microsoft“ paaiškinimas, kas ateina su „Bing“ / „Tellme“ / „social-graph“ integracija:

„Mes matome ateitį, kurioje tarnyba jus pažins: žinos jūsų ketinimus, socialinius ir verslo ryšius, patinka ir nepatinka, jūsų privatumo nuostatos ir dalykai, kurie apibrėžia kontekstą, kuris yra svarbus tu. Rezultatas bus kalbos NUI paslauga kuri padeda atlikti kasdienes užduotis natūraliau ir bendraujant. Ši paslauga supaprastins užduotis, kurios anksčiau buvo varginančios arba neįmanomos televizoriuje ar kitame įrenginyje, derindama kalbos supratimą ir ketinimus su giliomis jūsų, vartotojo, žiniomis. Mes įsivaizduojame ateitį, kurioje remsimės patirtimi, kurią šiandien teikiame naudodami „Kinect“, skirtą „Xbox 360“, „Windows Phone“ arba „Bing“, skirtą „iPad“ ar „iPhone“ programoms, patobulindami kalbos NUI patirtis, kad suprastumėte daugiau konteksto sluoksnių: ką darote, kur tai darote, naudojamų įrenginių tipus ir istorinę informaciją pirmenybės. Kadangi tai yra debesimis pagrįsta paslauga, jūsų sąveika gali išlikti laikui bėgant, todėl galėsite tęsti ten, kur baigėte, neatsižvelgiant į tai, kokį įrenginį naudojate.

Šis „supratimo ketinimų“ darbas yra dalis „Microsoft“ pastangų, kad „Bing“ rezultatai būtų labiau individualizuoti, sakė Bukshteyn. Ir Tellme čia vaidina svarbų vaidmenį dėl kalbos duomenų kiekio, kurį jis renka ir naudoja siekdamas pagerinti rezultatų tikslumą. „Tellme“ šiuo metu apdoroja 11 milijardų „pasitarimų“ per metus, sakė Bukshteyn.

Nors Tellme komanda daugiausia dėmesio skiria šių ilgalaikių scenarijų įgalinimui, ji tęs savo darbą vykdant artimesnio laikotarpio projektus, pvz., teikiant interaktyvų atsakymą balsu (IVR) klientams ir Partneriai. (Šiandien „Tellme“ veikia nemažai automatinių balso skambučių valdymo sistemų.) Ir komanda dirba, kad pridėtų kalbos programavimą sąsaja su Windows Phone, kad kūrėjai galėtų rašyti programas, kurios naudojasi telefono platformoje integruota kalbos technologija. Bukshteyn neturėjo laiko pasidalyti, kada „Windows Phone“ kūrėjai gali gauti šį API palaikymą.

Tellme komanda taip pat planuoja pridėti Tellme kalbos debesies palaikymą prie Windows Azure tašką, kad kūrėjai galėtų kurti ir palaikyti IVR įgalintas programas ir paslaugas Azure. Tellme kalbos debesis šiandien neveikia Azure; Bukshteyn sakė, kad nėra tvirto grafiko, kada ir ar „Microsoft“ gali perkelti jį į „Azure“. Tačiau „Tellme“ paslauga bus prieinama trečiųjų šalių kūrėjams, nepaisant to, ar „Microsoft“ perkelia „Tellme“ į „Azure“, ar ne.

Ar kalba yra nedainuota „Microsoft“ NUI istorijos dalis? Ar kalbos palaikymas suteiks „Microsoft“ produktams daug pranašumo prieš konkurentus?