Чатботът ChatGPT, разработен от OpenAI, е способен да дава отговори на въпроси по всякакви теми - от ядрено инженерство до стоическа философия. Проблемът е, че добрите му резултати засега са само на английски език. 

The Economist споделя, че най-новата версия - ChatGPT-4, отбелязва 85% на общ тест с въпроси и отговори. На други езици обаче тя съвсем не се представя толкова впечатляващо.

При полагане на теста на индийския език телугу, например, говорен от близо 100 милиона души, чатботът отбелязва само 62% верни отговори. 

OpenAI не разкрива много подробности за това как е създаден ChatGPT-4. Но един поглед към неговия предшественик ChatGPT-3 може да даде някои насоки. Големите езикови модели (LLM) се обучават върху текст, извлечен от интернет, където английският език доминира в много голяма степен.

Около 93% от данните за обучение на ChatGPT-3 са били на английски език. В Common Crawl, който е само един от наборите от данни, върху които е обучен моделът, английският съставлява 47% от корпуса, като други (най-вече сродни) европейски езици представляват 38%. 

Вижте повече на Darik Business Review.

Слушайте и гледайте новия подкаст на darik.bg „В тренда“ в YouTube, Instagram и TikTok

Най-интересните разговори от ефира на Дарик слушайте в подкаста на радиото в SoundcloudSpotifyApple Podcasts и Google Podcasts

Следвайте ни в LinkedInФейсбук, TikTok и Инстаграм