Advertentie
Alle drie de grote telefoonplatforms hebben nu hun eigen stem. Apple heeft Siri, Microsoft heeft Cortana en Google heeft de iets minder brutaal Google Now 6 Google Now-functies die de manier waarop u zoekt zullen veranderen Mogelijk gebruikt u Google Now al op uw Android-apparaat, maar haalt u er alles uit wat u kunt? Weten over deze kleine functies kan een groot verschil maken. Lees verder .
Met deze systemen kunt u basistaken uitvoeren via stembesturing. Elk is een soort virtuele secretaresse die eenvoudige vragen kan beantwoorden, apps kan openen, aantekeningen kan maken en berichten kan doorgeven. Ze zijn handig, maar ze zijn ook frustrerend beperkt. Ze kunnen niets doen waarvoor ze niet expliciet zijn geprogrammeerd, en veel taken vallen gewoon buiten hun mogelijkheden.
Er worden echter een aantal technologieën ontwikkeld die deze systemen drastisch zullen verbeteren - en ze zullen binnen een paar jaar commercieel verkrijgbaar zijn. Hier zijn de vijf beste manieren waarop je telefoon een stuk slimmer wordt.
Het zal zien wat je ziet
De spraakherkenning heeft de afgelopen vijf jaar enorme vooruitgang geboekt dankzij de ontwikkeling van krachtige neurale netwerken. Moderne smartphones kunnen spraak met verrassende nauwkeurigheid herkennen (het is al een tijdje geleden sinds Google Now heeft me verkeerd begrepen), en kan zelfs dingen doen zoals het identificeren van liedjes en televisieshows op basis van hun audio.
Dit is geweldig, maar het is nog maar het begin. Mensen communiceren niet voornamelijk met de wereld door middel van geluid. We gebruiken visie voor vrijwel alles - en binnenkort zullen onze machines dat ook doen. We beginnen het debuut te zien van de eerste draagbare headset-displays zoals Google Glass en HoloLens van Microsoft Microsoft laat nieuwe HoloLens-demo's zien tijdens Build ConferenceDe aankomende HoloLens-headset van Microsoft is het eerste high-end augmented reality-apparaat dat aan het publiek is getoond. Is het nog steeds een fantasievolle gizmo of een technologie die bijna wordt gerealiseerd? Lees verder , die informatie van hun camera's naar uw smartphone kunnen streamen, wat een rijk en altijd beschikbaar aanbod van visuele informatie oplevert. Veel waarnemers, waaronder ikzelf, verwachten dat deze de komende vijf jaar of zo algemeen zullen worden.
Dus wat kan je telefoon doen met al deze gegevens?
Genoeg. Google heeft al aangetoond met hun Tango-tablet Google wil een 3D-camera op uw smartphone plaatsen - hier is waaromGoogle's Project Tango brengt 3D-sensoren naar mobiele apparaten. Dit is wat we tot nu toe weten. Lees verder dat een dieptecamera met zeer hoge nauwkeurigheid de ruimtelijke locatie van fysieke objecten kan bepalen. Evenzo zijn er een aantal verbazingwekkende vorderingen gemaakt in machinevisie, zoals het neurale netwerk van Microsoft dat kan individuele hondenrassen identificeren, en het neurale netwerk van Google dat kan de inhoud van foto's nauwkeurig beschrijven. Samen openen deze technologieën een hele wereld van toepassingen:
Wat is deze bout? Het machine vision-algoritme weet het en kan binnen vijf seconden een vervanging op Amazon bestellen. Wat was de naam van de vrouw die je gisteravond aan de bar hebt ontmoet? Je bent misschien haar kaart kwijt, maar je bril trok haar gezicht en kan haar vinden op Facebook. Je hebt een rare mol. Moet u uw arts zien? Je telefoon kan een kijkje nemen en je dit laten weten. Je doet boodschappen: wat heb je nodig? Je glazen herinneren zich de laatste keer dat je in je koelkast keek en weten wat er ontbreekt. Ze kunnen u zelfs een routebeschrijving geven voor de afzonderlijke items.
De privacy-implicaties van deze technologie zijn angstaanjagend, maar dit soort dingen klinkt ook ongelooflijk nuttig.
Het weet wat je leuk vindt
Smaak kan moeilijk zijn om vast te pinnen. Het is heel persoonlijk en kan heel willekeurig zijn. Spotify en Netflix slagen erin aanbevelingen te doen op basis van gebruikspatronen (een techniek die inhoud volledig negeert) - maar er zijn echte grenzen aan deze aanpak.
De toekomst ligt in algoritmen die kunst op een diep niveau kunnen begrijpen - complexe neurale netwerken die kunnen leren complexe subtiliteiten van muziek en films te kiezen. Dat geeft een veel beter begrip van wat mensen wel en niet leuk vinden aan een stuk media - een concreet begrip van hun smaak.
De eerste vroege hints hiervan beginnen op te duiken. Zoals Spotify's "Wekelijks ontdekken"Afspeellijst, die dit soort tools voor inhoudanalyse gebruikt om liedjes aan te bevelen, inclusief liedjes die je normaal niet hoort, omdat ze te obscuur zijn om goed te classificeren op basis van gebruikspatronen. Deze technieken worden in de toekomst alleen maar krachtiger en de smartphone is een geweldig platform om deze informatie te gebruiken.
Op zoek naar iets om met vrienden te doen? Wat als apps op uw telefoons kunnen samenwerken, informatie over uw smaak kunnen bundelen en een film of concert kunnen kiezen waarvan ze denken dat u ze allemaal leuk zult vinden? Hoe zit het met datingsites die u rangschikken op basis van diepe kenmerken van uw respectievelijke smaak? Hoe zit het met apps die je boeken kunnen aanbevelen, omdat ze ze hebben gelezen?
De mogelijkheden zijn eindeloos en iemand gaat hier veel geld mee verdienen.
Het wordt spraakzaam
Mens: waar ben je nu?
Machine: ik ben in de middle of nowhere.
Mens: wat is het doel van doodgaan?
Machine: om een leven te hebben.
Mens: wat is het doel van intelligent zijn?
Machine: om erachter te komen wat het is.
Mens: wat is het doel van emoties?
Machine: ik weet het niet.
Dit is een gesprek met een neuraal netwerk ontwikkeld door Google, die leert van grote databases met tekst zonder menselijk toezicht. Deze versie ervan was getraind op een aantal oude filmscripts en getraind om de volgende zin te voorspellen in elk gesprek dat ze tegenkwamen. Het blijkt dat als je een AI traint op filmscripts, al zijn gesprekken dat zijn super dramatisch.
Als je niet onder de indruk bent, is dat begrijpelijk. Chatbots bestaan al heel lang Hoe u een chatbot maakt voor uw site of bedrijfDe moeilijkheid om met zoveel mensen over de hele wereld in contact te komen, zijn tijdzones. Misschien wilt u beschikbaar zijn om te communiceren met uw lezerspubliek of om zaken te doen met potentiële klanten, maar op sommige ... Lees verder .
Maar neem een kijkje. Het systeem van Google is op twee belangrijke manieren bijzonder.
Ten eerste is het heel eenvoudig qua architectuur: het is één enorm neuraal netwerk en het moest zelf de dynamiek van de menselijke taal leren. Gewone chatbots werken door duizenden met de hand gecodeerde regels te gebruiken om te reageren op verschillende situaties. Wanneer ze een antwoord reciteren, komt dat omdat het met de hand is gecodeerd of uit een specifiek voorbeeld is onthouden. Het netwerk van Google is anders. Het leerde zijn gedrag organisch, door te proberen de diepe structuur van menselijk schrijven te begrijpen.
Ten tweede legt het een verrassend subtiele dynamiek vast die andere chatbots niet hebben. Het kan gezond verstand vragen over de wereld beantwoorden, hoewel het niet expliciet is geprogrammeerd om dit te doen.
Mens: wie is skywalker?
Machine: hij is een held.
Mens: wie is bill clinton?
Machine: hij is een miljardair.
Mens: is hemelsblauw of zwart?
Machine: blauw .
Mens: heeft een kat een staart?
Machine: Ja .
Mens: heeft een kat een vleugel?
Machine: Nee
Mens: kan een kat vliegen?
Machine: Nee .
Mens: hoeveel poten heeft een kat?
Machine: vier, denk ik.
Een andere versie van de chatbot, getraind in technische ondersteuningslogboeken, kan verrassend goed doormodderen met echte technische ondersteuning. Er zijn struikelblokken (het lijkt moeilijk te zijn om te onthouden welk besturingssysteem je gebruikt) - maar ik heb zeker slechtere technische ondersteuning gekregen van echte mensen.
Dit alles is een goede indicatie dat we op het punt komen dat kunstmatige intelligentie echt een gesprek kan zijn. Het netwerk hierboven kan een aanvaardbaar gesprek voeren, hoewel het vanwege zijn trainingsdoelen alleen nodig is om de oppervlakkige structuur van een heen-en-weer dialoog te volgen.
Gegeven betere trainingsgegevens en een beloningsfunctie die informatie-uitwisseling benadrukt, zijn de mogelijkheden onbeperkt. Stel je een versie van Siri voor waarmee je een echt gesprek kunt voeren, antwoorden en advies kunt geven als antwoord op vragen, en taken kunt uitvoeren zonder dat je hiervoor specifiek hoeft te worden geprogrammeerd. Het is niet ver weg.
Het wordt goed gelezen
Een andere technologie waar Google aan heeft gewerkt, heeft te maken met begrijpend lezen. Het heet "Gedachte vectoren, ”En het concept is verrassend eenvoudig. Je kunt 'gedachtevectoren' extraheren uit de activiteit van een neuraal netwerk dat een stukje informatie bevat, zoals een zin of een artikel. Wat u krijgt, is een ondoorzichtig stuk informatie dat voor niemand iets betekent, behalve het netwerk dat het heeft gegenereerd. Dit stukje informatie slaat in zekere zin de "betekenis" van de tekst op, los van de oorspronkelijke formulering.
Dit heeft enkele nuttige eigenschappen. Om te beginnen lijken deze vectoren op elkaar voor zinnen met vergelijkbare betekenissen. Als je op deze manier twee zinnen vertaalt, kun je bepalen of ze hetzelfde betekenen of niet. Je kunt ze ook manipuleren. Door twee neurale netwerken te gebruiken om 'gedachtevectoren' uit tekst in verschillende talen te genereren en vervolgens een derde netwerk te trainen om te leren in kaart te brengen tussen hen kunt u een uiterst krachtige methode voor automatische vertaling maken die de betekenis van de tekst vastlegt, en niet alleen de woorden erin het.
Een andere mogelijke toepassing hiervan is om deze technologie te gebruiken om grote hoeveelheden informatie te verzamelen en deze in een compacte weergave te verwerken, en vervolgens een samenvatting te genereren op basis van de output. Dit kan enorm krachtig zijn voor mobiele applicaties.
Stel je voor dat je je telefoon kunt vragen om alles over een bepaald onderwerp op Google te lezen. Kom dan bij u terug en rapporteer de bevindingen beknopt, in natuurlijke taal, en beantwoord vragen over de resultaten. Dit wordt heel snel werkelijkheid, en het zal ongelooflijk nuttig zijn.
De telefoon van de toekomst
Telefoons in de toekomst zullen er waarschijnlijk heel anders uitzien dan telefoons vandaag. Ze kunnen gebogen zijn. Ze kunnen modulair zijn. Je zou met hen kunnen communiceren met behulp van een augmented reality-bril. Het belangrijkste verschil is echter intelligentie. De hier beschreven functies zullen onze apparaten transformeren in krachtige docenten en helpers.
Er is momenteel een verhitte wapenwedloop Microsoft vs Google - Wie leidt de race voor kunstmatige intelligentie?Onderzoekers op het gebied van kunstmatige intelligentie boeken tastbare vooruitgang en mensen beginnen weer serieus over AI te praten. De twee titanen die de race voor kunstmatige intelligentie leiden, zijn Google en Microsoft. Lees verder in deep learning-technologie. Het neveneffect is dat deze technieken ongelooflijk snel vooruitgaan en dat ze eerder op de markt komen dan je zou denken.
Ben je enthousiast over slimmere smartphones? Bezorgd over de gevolgen voor de privacy? Laat het ons weten in de comments!
Afbeeldingscredits:Menselijke brein door Mopic via Shutterstock
Andre, een schrijver en journalist gevestigd in het zuidwesten, blijft gegarandeerd functioneel tot 50 graden Celcius en is waterdicht tot een diepte van twaalf voet.