25 жніўня, 2009

Google Translate: Перакладайце зь беларускай і на беларускую

Гэты жнівень - проста месяц прыемных навінаў :). Пасьля запуску Google Картографа для Беларусі, зараз - запуск Перакладчыка для беларускай мовы; першага аўтаматычнага анляйн-сэрвісу для беларускіх перакладаў.

Google Translate - гэта сыстэма статыстычнага перакладу, якая працуе на базе статыстычных мадэляў, а яны будуюцца на базе дакумэнтаў, перакладзеных прафэсіяналамі. Чым больш такіх перакладзеных дакумэнтаў выкарыстоўваецца для мадэлі, тым лепей атрымліваецца пераклад; і адносна малая колькасьць дакумэнтаў, перакладзеных на беларускую і зь беларускай, зьяўляецца прычынай таго, што беларуская мова была дададзеная пазьней за іншыя, і якасьць перакладу можа быць яшчэ не заўсёды здавальняючая. Але зараз якасьць будзе толькі паляпшацца. Болей пра тое, як працуе Google Translate і статыстычны пераклад - глядзіце ў відэа-дакладзе распрацоўшчыка Дзьмітрыя Гензеля (па-расейску), ці пачытайце кароткія ўводзіны ў машынны пераклад тут.

У статыстычныя мадэлі могуць заўсёды пралезьці "дзіўныя" памылкі, кшталту блытаніны аднаго чалавека зь іншым (як у нядаўнім выпадку зь Януковічам). Вялізны памер мадэлі, плюс тое, што ў камандзе Translate няма людзей, якія размаўляюць на ўсіх мовах (у прыватнасьці, няма беларусаў), не дазваляе праверыць яе ўсю - таму памылкі такога кшталту будуць. Калі вы заўважыце, што зь беларускай ці на беларускую якое-небудзь прозьвішча, ці назву, ці краіну перакладаюць абсалютна іншым імем ці назвай - напішыце мне (камэнтам, на пошту ці ў твітэр), і я паведамлю камандзе для выпраўленьня.

А пакуль - перакладайце тэксты з моў, якія вы ня ведаеце. Цікава, што ж там пішуць іранскія блогеры..

Фолаўце мяне ў твітэры - @mahaniok_be, я зьмяшчаю ўсе навіны і спасылкі там.

Камэнтары 5 камэнтароў
skepsys выказаўся

Ці можна нейкім чынам прапанаваць для пашырэньня базы (і адпаведна якасьці пракладаў) прафэсыйна перакадзеныя на беларускую тэксты з замежных моваў (ангельскай, францускай, гішпанскай, літоўскай)?

Ihar Mahaniok выказаўся

Можна. Гэта будзе вельмі карысна. Калі ласка, напішыце падрабязьней мне на пошту (ihar@mahaniok.com)

Ананім выказаўся

Мае вітанні, Ігар! Мяне завуць Ганна і я прадстаўляю беларускі інтэрнэт-часопіс "Новая Эўропа". Нам вельмі цікава тое, што зрабіў Гугл у плане беларусізацыі ў апошні час (у прыватнасці, беларуская мова ў перакладчыку, беларускі картограф). Мы хацелі б паразмаўляць з Вамі, як прадстаўніком гэтага канцэрну - зрабіць невялічкі матэрыял. Да таго ж, беларус у Швейцарыі - гэта ўжо само па сабе выклікае цікавасць: а як там жывуць нашыя суайчыннікі і г.д. :)
Можа быць, Вы знойдзеце хвілінку для таго, каб пагаманіць на гэтую тэму. Можам звязацца праз скайп - soft_punk - альбо мэйл: hazeta2007@gmail.com
Вельмі чакаю Вашага адказу, бо матэрыял мае пайсці ў нумар за 8 верасня, таму зрабіць яго патрэбна да абеду нядзелі. Спадзяюся на Вашую дапамогу.

Ананім выказаўся

Цудоўная справа зроблена! ДЗячу вельмі! Малойца!!!

Yauhen выказаўся

Дзякуй вялікі! Добрая справа

Post a Comment

Пра мяне

Ігар Маханёк

Інжынэр-праграміст у Google.
Інфармацыйны гік.
Сам зь Менску, але зараз жыву ў швайцарскім Цюрыху.

ihar@mahaniok.com
@mahaniok_be у Twitter

Падпішыся Стужка


Падпісвайцеся на мой блог у Google Reader, па e-mail, альбо дадайце [info]mahaniok_be ў фрэндстужку ў ЖЖ.
Альбо проста фолаўце мяне ў твітэры, я зьмяшчаю ўсе спасылкі там:

Friend Connect Чытачы

Калі ласка, далучайцеся.

Мой профіль на Friendfeed Я ў інтэрнэце

Twitter


Friendfeed

Заўвага

Мае думкі і выказваньні могуць не адлюстроўваць пазыцыю майго працадаўца.