Advertentie
ì´ ì›¹ì‚¬ì´íŠ¸ì— 환ì˜. ì´ê²ƒì€ 보기 ì›ë³¸ì´ë‹¤
Welke taal is dit? Chinese? Japans?
Het is eigenlijk Koreaans. Dit handmatig detecteren zou me veel tijd hebben gekost. Gelukkig heb ik een aantal zeer nauwkeurige tools gevonden die dit automatisch kunnen doen. Ze staan hieronder allemaal vermeld.
Het experiment: Ik heb de websites getest met voorbeeldtekst (1-2 zinnen met 8 woorden) uit de volgende talen: Portugees, Russisch, Koreaans, Vietnamees, Italiaans, Turks, Pools, Oekraïens, Azerbeidzjaans, Sloveens, Macedonisch, Nederlands, Filipijns (Tagalog), Grieks, Galicisch, Tsjechisch, Wit-Russisch, Fins, Tataars en Noors.
In totaal heb ik 20 verschillende talen getest.
3 hulpmiddelen om tekst in onbekende taal te detecteren
1. LangId (geslaagd voor 18 van de 20 tests, niet voor Tataars en Wit-Russisch)
Voordelen: Al met al een geweldige online tool. Het biedt basisfunctionaliteit voor tekstdetectie en ze hebben ook: Twitter en e-maildetectiebots voor nog snellere resultaten.
nadelen: Hun engine is gebaseerd op Google API, maar ze lijken betere resultaten te hebben dan de hieronder beschreven Google-detector. Het lijkt erop dat ze de dingen heel goed weten te gebruiken. Ik vond het niet leuk dat ze niet hun eigen unieke algoritme hebben om talen te detecteren.
2. Google-taaldetector [niet meer beschikbaar] (geslaagd voor 17 van de 20 tests, niet voor Portugees, Taglog en Wit-Russisch)
Voordelen: Google heeft een van 's werelds beste API's voor taaldetectie. Het goede is dat je de kans kunt zien dat het resultaat dat ze weergeven waar is. Ze konden de meeste voorbeeldtests doorstaan.
nadelen: Ik was nogal verrast dat ze de Portugese test niet doorstonden. Het lijkt erop dat ze een (ik hoop tijdelijke) bug hebben met deze taal. Ze kunnen ook zeker beter werk leveren door het pagina-ontwerp beter te maken.
3. Welke taal is dit (geslaagd voor 11 van de 20 tests, niet voor Russisch, Koreaans, Oekraïens, Azerbeidzjaans, Macedonisch, Tagalog, Grieks, Galicisch en Tataars)
Voordelen: Sommige talen, zoals de Zuid-Slavische (Servisch, Kroatisch, Sloveens), lijken veel op elkaar. Als u Kroatische tekst invoert, laten we zeggen, deze website zal u vertellen dat de tekst ook Servisch of Sloveens kan zijn.
nadelen: Ze moeten werken aan het geavanceerder maken van hun detectiesysteem. ik zat te denken om te zetten Translated.net (een andere website voor taaldetectie) in plaats van deze, maar Translated beloofde detectie van meer talen en deed het eigenlijk slechter dan WhatLanguageIsThis.com.
2 tools om websites in onbekende talen te detecteren
4. Google Vertalen met Taal detecteren als de eerste optie
Geslaagd: 18 van de 20, niet geslaagd voor Wit-Russisch en Tataars.
Voordelen: Deze tool doet zijn werk erg goed. Wat ik leuk vind aan Google Vertalen Google Translate 2.1 verschijnt met native iOS 7-toetsenbord en meer taalondersteuningUpdate naar Google Translate 2.1 op uw iOS-apparaat en neem ondersteuning mee voor vertaling en ondersteuning voor handschriftinvoer voor nieuwe talen. Google Translate krijgt eindelijk een nieuw iOS 7-toetsenbord om alle... Lees verder is dat als het een specifieke taal niet ondersteunt, je het volgende scherm krijgt:
Dat is een geweldige taaldetector als je het mij vraagt!
5. Microsoft Bing Vertaler met Automatische detectie als eerste optie.
Geslaagd: 8 van de 20, niet geslaagd Nederlands, Vietnamees, Turks, Oekraïens, Azerbeidzjaans, Sloveens, Macedonisch, Tagalog, Grieks, Galicisch, Tsjechisch en Wit-Russisch
Voordelen: Het ondersteunt een beperkt aantal talen. Voor die talen doet het zijn werk goed.
nadelen: Ik ben erg teleurgesteld in Microsoft. Ze hebben een zeer beperkt aantal talen voor detectie & vertaling Vergeet Google Translate: 3 manieren om een nauwkeurige, snelle vertaling te krijgenOf u nu van plan bent om te solliciteren naar een baan of een appartement in het buitenland, of uw webpagina wilt vertalen, u moet het goed doen, zelfs met een vreemde taal. Lees verder en hun Auto-Detect-functie is verschrikkelijk. Als je een taal invoert die ze niet ondersteunen, krijg je een verkeerd resultaat in plaats van je te vertellen dat ze die taal niet ondersteunen.
Gedachten
Over het algemeen ben ik van mening dat de bovenstaande tools de goede kant op gaan. Ze zijn momenteel de beste voor het online detecteren van talen en doen hun werk redelijk goed als het gaat om populaire talen. Ze moeten echter werken aan het toevoegen van meer obscure talen (geen van de tools kon Tatar herkennen) en ik weet zeker dat ze allemaal, vooral Google, in de nabije toekomst in die richting zullen gaan.
Afbeelding tegoed: Kanko*
Mijn naam is Darko (bijnaam Darren.) Ik hou van Web 2.0, nichewebsites maken (mijn laatste project is mensen zoeken) enzovoort...wat kan ik nog meer over mij zeggen in zo'n kort profiel, volg mijn op Twitter als je meer wilt weten :)