Mir'ritil

There is something new in every bit

Previous Entry Add to Memories Share Next Entry
Белорусская и совковая журналистика про Google Translate
Mir'ritil
[info]mirritil
Забавный был вчера день.

Команда Google Translate запустила 9 новых языков примерно в ~4-5 утра (по беларусскому времени). Придя на работу, я обнаружил этот факт, и сообщил об этом в твиттере (около 10:50). К тому времени уже семь часов как можно было пользоваться беларусским в Translate, но никто не заметил.

Предвидя, что "толерантные" беларусы сразу бросятся искать проблемы и найдут что-то типа "проблемы Януковича", я написал достаточно подробный пост, где объяснил про суть статистического перевода, и про то, почему короткие фразы могут переводиться неоптимально.

В 12:54 generation.by опубликовали длинный и толковый пост. В 14:09 на "НН" появилась короткая новость - без единой гиперссылки, но и без глупых/неверных утверждений. Остальные новостники ещё долго спали в шапку.

Кто-то мне сообщал об ошибках перевода, а [info]beatleofdoom опубликовал пост, в котором обратил внимание, как при переводе меняются маленькие и большие буквы.

В 16:09 naviny.by написали короткую новость, в которой упомянули меня, но не дали ни единой гиперссылки. Далее, очнулся Electroname, и в 16:51 написал новость, в которой без указания источника скопировал абзац из официального FAQ. Неуказание источника привело к тому, что радостно перепечатавшая хартия сформулировала "При экспериментальной оценке система показала очень хорошие результаты, сообщает сайт Electroname.com." (не оставив ссылки на новость на Electroname, конечно же). Хартию ещё через полтора часа перепечатало Радыё Рацыя (тоже без ссылки).

Единственный более менее толковый обзор к этому времени дало "Радыё Свабода" - молодцы. Если бы у них ещё вебмастеры были с руками из нужного места (эх, если бы не та авария...), то был бы лучший информационный сайт страны.

А дальше начинается сюр. На Хабрахабре некий alizar в 18:50 публикует смешной пост, в котором из поста beatleofdoom делает вывод, что это была моя хитрая задумка и, значит, я был "одним из авторов белорусского направления перевода". Забавно, особенно учитывая, что таким образом он мне приписывает то, что мало что я сам менял буквы с маленькой на большую в некоторых фамилиях, так ещё и "беларускую мову" как "русский язык" перевёл (хотя очевидно, что всё это - результаты работы статистической модели). Ну ладно, хабр - это как личный дневничок, мы посмеялись в твиттерах и забыли (а кто-то и указал на неверность предположения о моей причастности в комментах). Ан нет. Самый большой (по количеству посетителей) информационный сайт страны, tut.by, решил поздно вечером опубликовать новость, взяв её из самого ненадёжного источника - с хабра (при этом, как и все прочие, не поставив линк на оригинал), и забив на проверку информации. Конечно, tut.by - это не журналистский портал, а перепечатный, но могли бы вместо хабра даже хартию перепечатать - и то правильнее было бы.

Ну и финальным аккордом стало сегодняшнее письмо от Еврорадио: "Я рыхтую рэпартаж пра беларускі перакладчык Google. якім Вы займаліся". Еврорадио не разместило новости вообще, а интервью планируют взять только завтра (через два дня после инфоповода); и, судя по всему, они пока совершенно не занимались изучением вопроса.

Одно радует в этом фарсе журналистики. То, что эта новость совершенно неинтересна Прессболу - наиболее жёлтой газете с пещерными, мелочно-карманными и низкокачественными методиками работы. (update: речь только о вебсайте, бумажный прессбол я уже года три в руках не держал)

Ну и напоследок хорошее: сегодня "НН" опубликовала короткое интервью со мной, ничего не переврав и сохранив нужные гиперссылки. Правда, у них совершенно поехавшее форматирование и отсутствует ссылка на translate.google.com - но это уже мелочи на фоне всех остальных.

UPDATE: Гендиректор TUT.BY Юрий Зиссер разобрался, и в перепечатке с Хабра уже нет неверной информации. Автор того поста Alizar тоже извинился, правда, пост менять не стал.

написал бы зиссеру в твиттер чо

он вполне в курсе политики их ресурса. этот случай совершенно нормален для перепечатного сайта, и они вряд ли перейдут на другую модель :).

да и он читает мой твиттер, авось зайдёт по ссылке.

см. апдейт в посте. таки да, твиттер жжот

Які дробязны! :)

ну, даўно на гэтую тэму жадаў напісаць, бо закалябаў гэты "пячорны пэрыяд" у беларускім анляйне. але вось зьявіўся "інфаповад" )

а чо за наезды на Прэсбол?

ну ты пачытай іхнюю навінавую стужку - які сюр яны туды піхаюць без спасылак на крыніцы.

апошні іх пэрл - перапост-пераклад (з памылкамі) інтэрвію Шмоліка Эўрарадыё, бязь лінка на арыгінал, без пазначкі, што гэта пераклад, і з выразаным словам "Эўрарадыё" з тэксту - быццам самі ўзялі.

ааа, ты пра гэта... у любым выпадку імхо "Прэсбол" найлепшая спартовая газета на рускамоўнай тэрыторыі

лол.
сытуацыя такая, што яны адзіны інфармацыйны спартовы рэсурс у краіне (з пункту гледжаньня колькасьці інфармацыі).

але з расейскімі выданьнямі ніякай канкурэнцыі. Той жа sports.ru на лапаткі кладзе Прэсбол.

ну я меў на ўвазе хутчэй папяровую версію...
асабліва ўлічваючы іх палітыку - у тым сэнсе што ўпор робіцца на газету, а сайт - гэта давесак. У іх раней са спазьненнем артыкулы публікаваліся на сайце, а зараз наколькі я ведаю ўвогуле платны пдф-увялі, а сайт - гэта так...

папяровую я не чытаю, таму параўнаць не магу. я пра анляйн.

>>Белорусская и совковая журналистика про Google Translate

Игорь, включаете "белоруса"? Вместо того, чтобы поблагодарить за бесплатную рекламу, брызжете слюной.

где бесплатная реклама? в новостных постах с ложными сведениями?

Generation.by не зусім СМІ (ў традыцыйным разуменьні). Аднак пасьля твайго твіта ў нас першых (у 12:54) зьявілася навіна :)) «Google Translate навучыўся перакладаць зь беларускай і на беларускую»

ты правы. выбачай. дадам зараз у пост :)

з тэхнічнага пункту гледжаньня, і з пункту гледжаньня якасьці і этыкі журналістыкі, вы адназначна на галаву вышэй усіх астатніх анляйн-рэсурсаў згаданых у пасьце (ды й наагул у Беларусі, напэўна). Як бы вам яшчэ падняць вядомасьць)

Edited at 2009-08-26 05:52 pm (UTC)

Дзякуй ))
Як выйдзем з тэставага пэрыяду, які цягнецца ўжо два гады - будзем займацца пашырэньнем вядомасьці, а пакуль важней утульнасьць ;)

ну после этого может появится :)

мы таксама напісалі пасля з'яўлення вашага паведамлення ў жж: http://prajdzisvet.org/main.do?method=loadEventsPage#event47 але напраўду навінавым сайтам не з'яўляемся.

alizar ето не хуй собачий, ето один из древнейших сотрудников хабра и бывший главред Компутерных вестей.

ваще я видел все с утра. ну заработал и заработал, тырнеты и софт - не наша тема. поста не читал. потом увидел у [info]silverrebel пост что есть ошбки. начала гонять слова и тут мне стукнуло вбить твою фамилию:) ну, чтобы если чо так слегка по-доброму подъебать.

но ето же не самый прикол, ализар, видимо, думает, что я это не я, а виртуал одного моего кореша:)

ну короче, я ж говорю, шо еще пару лет и ты станешь гурой байнета по типу машкова или носика или кто там еще есть?

а и ето, твоя активность по поводу гугла и беларуси создает впечатление, шо ето входит в твои рабочие обязанности.

у нас ни у кого не входит в рабочие обязанности активность по поводу Беларуси, к сожалению. потому приходится, иначе некому

дзіўна, а я чуў, што гэта насамрэч Маханёк у рэжыме рэальнага часу ўсе словы перакладае, а Зісер яму вялікія літары з кропкамі над ё падносіць. скажыце, гэта праўда??

дык вось хто такі той Маханёк :)

Хохохо! Прекрасно

бывают глюки перевода, которые прямо не объяснить в рамках статистического перевода. сам я наткнулся на следующее.

фраза "Помогите перевести!" переводится на латышкский "Help translate!" (в то время, как одиночные слова переводятся сносно.) Видимо, в латышский язык Google Translate ходит через английский мостик. Довольно забавный ход для малопереводимых языков.


З.Ы. кстати, Игорь, спасибо за сообщение о баге. Будете в Мюнхене -- добро пожаловать в гости. Правда, родной белорусский язык я почти забыл. будем разговаривать на каком-нибудь другом :)

ха, сапраўды сквапнасьць што да спасылак на першакрыніцы — дыягназ шмат якіх рэдактараў тутэйшых сайтаў. можна падумаць, што іх штрафуюць за кожную спасылачку ;)

І, дарэчы, на google.com таксама адсутнічае спасылка на translate.google.com Трэба два кліка, каб знайсьці старонку са спасылкай на translate. А калі не ведаеш, дзе шукаць, то нашмат больш.

(Screened comment)
(Screened comment)
(Screened comment)
(Screened comment)

Re: Маханек, Маханек, Маханек...

[info]kirik17

2009-09-06 03:28 pm (UTC)

ого, сенсация. вот по этому мега "факту" можно сразу понять как работает мозг отдельно взятого журналиста.
просто кладезь интеллекта.

к сожалению это ваш удел пухнуть от зависти в организациях за 400 тысяч.

(Screened comment)

Re: Маханек, Маханек, Маханек...

[info]kirik17

2009-09-06 07:32 pm (UTC)

"А ты не трынди, пацан."

о май гад. вам не стыдно жить?

Re: Маханек, Маханек, Маханек...

[info]slaver_be

2009-09-06 07:36 pm (UTC)

Гэта нейкі пануры троль проста.

Re: Маханек, Маханек, Маханек...

[info]mirritil

2009-09-06 07:43 pm (UTC)

паходу трэба "закрываць лавачку" камэнтаваньня)

Re: Маханек, Маханек, Маханек...

[info]slaver_be

2009-09-06 07:44 pm (UTC)

Ананімам дык дакладна.

Re: Маханек, Маханек, Маханек...

[info]mirritil

2009-09-06 08:22 pm (UTC)

зроблена.

You are viewing [info]mirritil's journal