25 жніўня, 2009

Google Translate: Перакладайце зь беларускай і на беларускую

Гэты жнівень - проста месяц прыемных навінаў :). Пасьля запуску Google Картографа для Беларусі, зараз - запуск Перакладчыка для беларускай мовы; першага аўтаматычнага анляйн-сэрвісу для беларускіх перакладаў.

Google Translate - гэта сыстэма статыстычнага перакладу, якая працуе на базе статыстычных мадэляў, а яны будуюцца на базе дакумэнтаў, перакладзеных прафэсіяналамі. Чым больш такіх перакладзеных дакумэнтаў выкарыстоўваецца для мадэлі, тым лепей атрымліваецца пераклад; і адносна малая колькасьць дакумэнтаў, перакладзеных на беларускую і зь беларускай, зьяўляецца прычынай таго, што беларуская мова была дададзеная пазьней за іншыя, і якасьць перакладу можа быць яшчэ не заўсёды здавальняючая. Але зараз якасьць будзе толькі паляпшацца. Болей пра тое, як працуе Google Translate і статыстычны пераклад - глядзіце ў відэа-дакладзе распрацоўшчыка Дзьмітрыя Гензеля (па-расейску), ці пачытайце кароткія ўводзіны ў машынны пераклад тут.

У статыстычныя мадэлі могуць заўсёды пралезьці "дзіўныя" памылкі, кшталту блытаніны аднаго чалавека зь іншым (як у нядаўнім выпадку зь Януковічам). Вялізны памер мадэлі, плюс тое, што ў камандзе Translate няма людзей, якія размаўляюць на ўсіх мовах (у прыватнасьці, няма беларусаў), не дазваляе праверыць яе ўсю - таму памылкі такога кшталту будуць. Калі вы заўважыце, што зь беларускай ці на беларускую якое-небудзь прозьвішча, ці назву, ці краіну перакладаюць абсалютна іншым імем ці назвай - напішыце мне (камэнтам, на пошту ці ў твітэр), і я паведамлю камандзе для выпраўленьня.

А пакуль - перакладайце тэксты з моў, якія вы ня ведаеце. Цікава, што ж там пішуць іранскія блогеры..

Фолаўце мяне ў твітэры - @mahaniok_be, я зьмяшчаю ўсе навіны і спасылкі там.

Камэнтары 6 камэнтароў
Ананім выказаўся

Ці можна нейкім чынам прапанаваць для пашырэньня базы (і адпаведна якасьці пракладаў) прафэсыйна перакадзеныя на беларускую тэксты з замежных моваў (ангельскай, францускай, гішпанскай, літоўскай)?

Unknown выказаўся

Можна. Гэта будзе вельмі карысна. Калі ласка, напішыце падрабязьней мне на пошту (ihar@mahaniok.com)

Ананім выказаўся

Мае вітанні, Ігар! Мяне завуць Ганна і я прадстаўляю беларускі інтэрнэт-часопіс "Новая Эўропа". Нам вельмі цікава тое, што зрабіў Гугл у плане беларусізацыі ў апошні час (у прыватнасці, беларуская мова ў перакладчыку, беларускі картограф). Мы хацелі б паразмаўляць з Вамі, як прадстаўніком гэтага канцэрну - зрабіць невялічкі матэрыял. Да таго ж, беларус у Швейцарыі - гэта ўжо само па сабе выклікае цікавасць: а як там жывуць нашыя суайчыннікі і г.д. :)
Можа быць, Вы знойдзеце хвілінку для таго, каб пагаманіць на гэтую тэму. Можам звязацца праз скайп - soft_punk - альбо мэйл: hazeta2007@gmail.com
Вельмі чакаю Вашага адказу, бо матэрыял мае пайсці ў нумар за 8 верасня, таму зрабіць яго патрэбна да абеду нядзелі. Спадзяюся на Вашую дапамогу.

Ананім выказаўся

Цудоўная справа зроблена! ДЗячу вельмі! Малойца!!!

Unknown выказаўся

Дзякуй вялікі! Добрая справа

Adam выказаўся

Вось яшчэ адзін нядрэнны беларускі перакладчык http://be.opentran.net/

Post a Comment

Пра мяне

Ігар Маханёк

Інжынэр-праграміст у Google.
Інфармацыйны гік.
Сам зь Менску, але зараз жыву ў швайцарскім Цюрыху.

ihar@mahaniok.com
@mahaniok_be у Twitter

Падпішыся Стужка


Падпісвайцеся на мой блог у Google Reader, па e-mail, альбо дадайце [info]mahaniok_be ў фрэндстужку ў ЖЖ.
Альбо проста фолаўце мяне ў твітэры, я зьмяшчаю ўсе спасылкі там:

Friend Connect Чытачы

Калі ласка, далучайцеся.

Мой профіль на Friendfeed Я ў інтэрнэце

Twitter


Friendfeed

Заўвага

Мае думкі і выказваньні могуць не адлюстроўваць пазыцыю майго працадаўца.