Чатботът ChatGPT, разработен от OpenAI, е способен да дава отговори на въпроси по всякакви теми - от ядрено инженерство до стоическа философия. Проблемът е, че добрите му резултати засега са само на английски език.
The Economist споделя, че най-новата версия - ChatGPT-4, отбелязва 85% на общ тест с въпроси и отговори. На други езици обаче тя съвсем не се представя толкова впечатляващо.
При полагане на теста на индийския език телугу, например, говорен от близо 100 милиона души, чатботът отбелязва само 62% верни отговори.
OpenAI не разкрива много подробности за това как е създаден ChatGPT-4. Но един поглед към неговия предшественик ChatGPT-3 може да даде някои насоки. Големите езикови модели (LLM) се обучават върху текст, извлечен от интернет, където английският език доминира в много голяма степен.
Около 93% от данните за обучение на ChatGPT-3 са били на английски език. В Common Crawl, който е само един от наборите от данни, върху които е обучен моделът, английският съставлява 47% от корпуса, като други (най-вече сродни) европейски езици представляват 38%.
Вижте повече на Darik Business Review.
Слушайте и гледайте новия подкаст на darik.bg „В тренда“ в YouTube, Instagram и TikTok
Най-интересните разговори от ефира на Дарик слушайте в подкаста на радиото в Soundcloud, Spotify, Apple Podcasts и Google Podcasts