Wat zijn API's voor beeldherkenning en wat kunnen ze voor u doen? Dit artikel zal verduidelijken wat beeldherkenning is, wat een API doet en hoe het kan helpen dat u of uw bedrijf meer uit internet haalt. Beeldherkenning heeft een enorm potentieel voor bedrijven en voor individuele visueel beperkte internetgebruikers.
Wat is een beeldherkenning-API?
Beeldherkenning is waar een stuk software de kenmerken van een afbeelding detecteert en het nauwkeurig categoriseert. Als u bijvoorbeeld een afbeelding van een Ferrari 458 uploadt naar een API voor beeldherkenning, moet deze herkennen dat het een auto is en dat deze rood is (of zou moeten zijn). Afhankelijk van de API is verdere classificatie mogelijk afhankelijk van het type afbeelding dat u gebruikt.
Dit lijkt misschien heel simpel: mensen kunnen naar een foto kijken en vertellen je waar het meestal om gaat, maar dit was een moeilijk probleem om computers te leren oplossen. Er is veel werk verzet om uit te zoeken hoe een computer kan begrijpen hoe dingen eruit zien, en we hebben grote stappen gemaakt, van de mogelijkheid om reverse image-zoekopdrachten te doen naar het beroemde Deep Dream-netwerk van Google.
Een API is een Application Program Interface. Het is in wezen een tussenpersoon tussen programmeerroutines die het ene element vertelt hoe met het andere te werken, of biedt de hulpmiddelen die ze nodig hebben om een functie uit te voeren. Er zijn tientallen soorten API's die allerlei doelen kunnen bereiken, met behulp van een reeks programmeertalen. In deze context is een API voor beeldherkenning het hulpmiddel dat u kunt gebruiken om toegang te krijgen tot de diepe leerkracht van sommige commerciële beeldherkenningssystemen.
U hebt veel rekenkracht nodig om beeldherkenning uit te voeren. Je hebt massa's gegevens nodig en de kracht om alles te interpreteren. De meeste gebruikers hebben eenvoudigweg niet de enorme middelen om hun eigen deep-learning-machine te bouwen. Grote namen zoals Google's Vision API, Face API van Microsoft, ImageNet en anderen hebben dergelijke machines en bieden toegang tot deze via API's, hetzij gratis of tegen betaling. Hierdoor kunnen bedrijven van elke omvang toegang krijgen tot deze kracht en krijgen gebruikers daardoor nieuwe ervaringen.
Hoe gaat beeldherkenning onze internetervaring veranderen?
Verschillende internetgebruikers krijgen verschillende voordelen van beeldherkenning. Laten we naar een hypothetische website-eigenaar en een hypothetische gebruiker kijken om te zien hoe beide partijen hiervan kunnen profiteren.
De zakelijke voordelen van beeldherkenning
Laten we bijvoorbeeld zeggen dat u een zelfverkopende portal uitvoert die lijkt op Etsy of een datingwebsite. U wilt de kwaliteit en geschiktheid van alle door gebruikers geüploade afbeeldingen beheren. Je wilt alle volwassen of ongeschikte afbeeldingen blokkeren en ze sorteren in de juiste categorieën, maar je kunt onmogelijk alles handmatig doen.
Voer de beeldherkenning-API in. U kunt de API, samen met een geschikte machine voor beeldherkenning, gebruiken om elke afzonderlijke afbeelding te scannen en deze op basis van ingestelde criteria te definiëren. U kunt dus de bibliotheek met afbeeldingen scannen voor onfatsoenlijke afbeeldingen en deze verwijderen. U kunt de afbeeldingen scannen en de afbeeldingen die voedsel bevatten, sorteren in de categorie 'eten' en knitwear in de categorie 'wollen'. Nadat u de API heeft verteld wat u moet doen, is het proces geautomatiseerd.
Er zijn ook kansen hier voor augmented reality en interactieve afbeelding en video. U kunt beeldherkenning gebruiken om een programma objecten in de echte wereld te laten herkennen. U kunt bijvoorbeeld een foto maken van een paar sneakers die iemand op straat draagt. Als het programma de sneakers herkent, kan de afbeelding worden uitgebreid met een link om ze zelf te kopen. Dit komt ten goede aan het bedrijf (het biedt een onmiddellijke verkoopkans) en komt de gebruiker ten goede (ze krijgen nu wat ze willen).
De voordelen voor de gebruiker van beeldherkenning
Het sneaker-voorbeeld hierboven is slechts een voor de hand liggende manier waarop gebruikers kunnen profiteren van beeldherkenning. Augmented reality betekent dat we direct toegang hebben tot recensies, prijsinformatie en veel gegevens door simpelweg een foto van een product te maken. Dat geeft gebruikers enorme hoeveelheden gegevens om een aankoopbeslissing te nemen.
Mark Zuckerberg vatte eerder dit jaar een vaak over het hoofd gezien voordeel voor beeldherkenning samen in zijn speech over KI. Hij stelde zich een beeldherkenning-API voor die met blinde of slechtziende mensen werkte die een beeld konden 'lezen' en beschrijven wat het hardop zag. Dit kan enorme gevolgen hebben voor gebruikers met een gestoorde internettoegang, of, met augmented reality, in de echte wereld enige tijd later.
Beeldherkenning speelt ook een rol bij de veiligheid van voertuigen. De nieuwe autonome technologie voor remmen en botsingvermijdingen die wordt geïntroduceerd, werkt op dezelfde manier als de API's waar we het over hadden. Ze scannen en beoordelen afbeeldingen vele malen per seconde om u en uw auto veilig te houden terwijl u onderweg bent. Deze technologie die autonome auto's vertelt wat er om hen heen is.
API's voor beeldherkenning zullen onze internetervaring op zichzelf niet revolutioneren. Ze werken samen met bestaande technologie om een laagje interactie en onderdompeling toe te voegen aan de wereld die we zien. Hoewel de voorbeelden van dit artikel beperkt zijn, is er een enorm potentieel voor games, films, de auto-industrie, detailhandel, entertainment en elke technologie-enabled industrie. Dit is slechts het begin van wat intelligente systemen kunnen bereiken!