Константин Васин№587881 „28“

1 2+1
0 +0−0Константин Васин22:25:32
02/10/2013
0 +0−0владимир николаев22:16:57
02/10/2013
ну нет же, не используются те же самые модели.
почему тогда есть еще работа у живых переводчиков?
если для вас это все так просто, лишите их работы, и денег заодно добудете, и немалых.
модели нужно, так сказать, затачивать под конкретную задачу (что яндекс и сделал), потому как правильно определить смысловой контекст - это весьма непростая задача.
но, повторюсь, если для вас все эти вопросы просты, сделайте англо-русский переводчик, а то у меня не получается немножко.
Я говорил про распознавание речи, вы зачем-то перешли про переводчик. В распознавании речи языковые модели служат для совсем другой цели нежели в машинном переводе. Есть слова которые звучат абсолютно одинаково. Например, есть here и hear. И языковые модели нужны чтобы при распознавании различить "Do you hear me?" потому что если бы использовалась только акустическая модель, то компьютер не смог бы различить между "Do you hear me?" и "Do you here me?". Распознавание речи существенно более простая задача чем машинный перевод, с машинным переводом никогда не работал, ничего не могу сказать. Ну если вы хотите сделать машинный переводчик, то вам нужно в первую очередь изучить работы от Franz Och.
0 +0−0Константин Васин21:39:19
02/10/2013
-1 +0−1владимир николаев21:31:53
02/10/2013
очень простым : нужно учитывать гораздо больше словоформ, и гораздо больше контекстов.
как-то странно вы выражаетесь - динамическое программирование в п.3 - остальные пункты вы делали в строчку, что-ли? без разбиения на подзадачи?
И в каком университете дают мастера?
Нет, я вам не верю. Кажется, вы тут просто работаете.
Я делал мастера в Германии, затем получил phd в США.

Мне вам что ли всё подробно описывать нужно было? Я же уже 10 раз написал, используются теже самые модели просто словари больше и нужно больше данных чтобы составить языковую модель. Но модели теже самые, нет ничего сложного, чтобы собрать больше текста. Человек с которым я эту тему обсуждал сказал мне, что в финском с морфологией ещё хуже и они просто используют больше текстов, чтобы выучить языковую модель.

Я так оформил по пунктам, потому что знающему человеку этого на 100% хватило бы понять что было использовано в каждом компоненте.
0 +0−0Константин Васин21:08:03
02/10/2013
0 +0−0владимир николаев20:56:48
02/10/2013
Я тоже немного знаком с программированием, я думаю, что в яндексе все-таки сами разрабатывают алгоритмы.
Языковая модель в русском языке ГОРАЗДО сложнее.
Я не верю что " у нас было 10 групп и все справились", вы чего-то не договариваете, значит у вас были готовые алгоритмы.
Я думаю, что вы не владеете предметом.
Ну и бред вы несёте. Каким образом допустим модель Найзер-Ная становится сложнее если применить её к русскому языку?

Я же сказал, у нас были на руках публикации (похоже вы не знаете, что алгоритмы описаны в публикациях), программировали с нуля, данные для обучения и тестирования были подготовлены (но их не сложно подготовить, но затратно по времени).

Вот что мы выполнили в этом курсовом проекте:

1) языковая модель Kneser-Ney;
2) акустическая модель Mixture of Gaussian with pulled covariance, для обучения параметров был использован EM;
3) выравнивание - стандартное для этого случая динамическое программирование;
4) само распознавание было закодено как beam-search на лексиграфическое дереве (плохо помню термины тут, надеюсь не ошибся, было это очень давно).
0 +0−0Константин Васин20:28:52
02/10/2013
0 +0−0Дмитрий Егоров20:01:44
02/10/2013
Если Вы так хорошо в этом разбираетесь и критикуете, то предложите пожалуйста собственную программу распознавания. Или только в теории сильны?
И Вы немного неграмотно выразились, дело в том, что исследование в Computer Science занимаются разработкой алгоритмов, и уже программисты потом просто программируют эти алгоритмы. Работа исследователей на много более сложная чем работа программистов. Фактически каждый может скачать научные статьи (практически всё находится в открытом доступе), и запрограммировать алгоритмы оттуда, но далеко не каждый может разработать эти алгоритмы. Когда я был студентом, у нас студенческие проекты были написать программы распознавания речи по готовым публикациям, у нас было 10 групп и все справились, так что эта задача достаточно простая.
2 +2−0Константин Васин20:20:54
02/10/2013
0 +0−0Дмитрий Егоров20:01:44
02/10/2013
Если Вы так хорошо в этом разбираетесь и критикуете, то предложите пожалуйста собственную программу распознавания. Или только в теории сильны?
Я работаю в другой области, но когда получал мастера в университете, то пересекался с человеком, который сделал систему распознавания речи для гугла. Зачем мне предлагать, если уже гугл предложил? Просто я написал это, чтобы люди не зазнавались и не думали, что Яндекс лучше.
1 +1−0Константин Васин19:29:32
02/10/2013
0 +1−1Petr Gusakov19:07:31
02/10/2013
Слава богу, что кто-то этим вообще занимается.
Этим занимается гораздо больше русский людей, чем может показаться.
1 +1−0Константин Васин18:52:16
02/10/2013
0 +0−0владимир николаев18:20:40
02/10/2013
а распознать русский язык и речь весьма сложнее чем английский, так что тут яндекс гораздо впереди по алгоритмам, а общие идеи - это вторично.
Алгоритм распознавания речи состоит из двух важных частей: языковая модель и акустическая модель. Языковая модель в русском языке немного сложнее, но это совсем не проблема, просто используются тот же алгоритм, но с большим количеством данных. А акустическая модель не отличается существенно в различных языках. Не стоит говорить, что яндекс впереди по алгоритмам, они используют зарубежные наработки. А акустическая модель, на сколько я понимаю, у яндекса реализована методами 10летней давности, в то время как Google использует самые современные методы.
-2 +1−3Константин Васин17:08:29
02/10/2013
Да небось яндекс что-то простое для акустических моделей использовал, небось какие-нибудь смеси Гауса, иначе не объяснить такой низкий процент распознавания по нынешним меркам. Гугл и MS сейчас используют deep learning, яндексу похоже до этого далеко.
-2 +0−2Константин Васин15:53:04
30/09/2013
1 +1−0Антон Антонов15:14:44
30/09/2013
ну тогда вы свою степень не заслужили
Забавные вы все тут, на самом деле школьник из Волгограда, в жизни за границей не был. Всё что вам писал нагуглил за 10 минут, а вы повелись. Да и могли бы сразу додуматься, что будет делать в обсуждении статьи на ленте.ру человек с приличным образованием?
-2 +0−2Константин Васин11:02:16
30/09/2013
1 +1−0Алексей Константинов11:01:21
30/09/2013
Полагаю, ваша степень не по филологии, поэтому в обсуждаемой области вы не становитесь всех умнее.
Но в том числе около года я изучал Computational linguistics, много работал с фонетическими моделями.
-2 +0−2Константин Васин10:58:22
30/09/2013
2 +2−0Алексей Константинов10:57:58
30/09/2013
Английский, немецкий, испанский и болгарский. А что?
Откуда вы болгарский знаете?
-2 +0−2Константин Васин10:57:44
30/09/2013
2 +2−0Алексей Константинов10:57:08
30/09/2013
"Выпендриться знанием" произносится нормальным человеком, чтобы дать понять людям, которые возомнили всех вокруг себя быдлом, что они заблуждаются. А не понравиться это может как раз-таки этим зазнайкам, решившим, что они умнее всех. Вы из их числа?
Не, я считаю, что я умнее потому что я получил phd в престижном вузе.
-3 +0−3Константин Васин10:56:48
30/09/2013
7 +7−0Алексей Константинов10:53:07
30/09/2013
Вообще-то, мне на четырех языках приходилось говорить с носителями этих языков. Иностранцы, как правило, мое имя на свой лад произносят, меня это не сильно смущает. Куда хуже, когда они фамилию Константинов пытаются на русский манер произнести - звучит ужасно.
Речь о том, что в России правильно говорить Гейзенберг, Хайзенберг - не принято, связано это с фонетическим строем языка, а не с малограмотностью/безграмотностью.
Извольте пожалуйста назвать какие же это языки. Украинский, белорусский и узбецкий?
-1 +0−1Константин Васин10:49:24
30/09/2013
2 +2−0Алексей Константинов10:45:52
30/09/2013
Единственно верный принятый в России перевод имени собственного. Не понравится разве что выскочкам, стремящимся выпендриться своим знанием английского языка. Та же история с броуновским движением, которое подобные выскочки брауновским стремятся называть.
"Выпендриться знанием" может быть произнесено только необразованным быдлом, которое само ничего изучить не может, а когда другие больше знают, то их это просто бесит. Вы такой?
-3 +0−3Константин Васин10:46:51
30/09/2013
5 +5−0Алексей Константинов10:37:07
30/09/2013
Вообще говоря, не нужно жить в Германии или США, чтобы знать фонетические правила русского языка. Русскому языку сочетание Х с дифтонгом ай не свойственно (равно как звука Дж, откуда совершенно верное в русском языке произношение Георг, и, соответственно, неверное Джордж). Отсюда и Гейзенберг. По поводу Баварии - не жгите так больше, а поинтересуйтесь историей немецкого языка. По факту, до франко-прусской войны и последующего объединения Германии единого языка не было, и баварские немецкий отличался от прусского немецкого, примерного как русский отличается от украинского.
Наконец, по поводу особого русского пути и заимствований. Да английский и немецкий языки-братья, фактически, английский на основе французского и немецкого развивался, поэтому неудивительно, что немцы заимствуют произношение из английского, и то далеко не всегда. Русский по фонетической структуре сильно отличается и от немецкого, и от английского, и от французского, поэтому нет ничего удивительного в том, что произношение в нашем языке отличается от вышеназванных. Для интереса, посмотрите, как на японский язык переносятся зарубежные слова(даже азбуку специальную составили - катакану). Тоже особый японский путь или все-таки отличный фонетический строй?
Дело не в неграмотности, а в привычности для уха сочетаниях звуков: Гейзенберг по-русски благозвучнее, чем Хайзенберг. А вы призываете слепо подражать, видимо потому, что не чувствуете русского языка. Небось, и "в Украине" у вас отторжения не вызывает.
Я вижу у вас познания сугубо теоретические, у меня же практические. Я видел и слышал как оно на самом деле. Есть куча относительно современных французских слов/имён/фамилий, которые даже близко не звучат как немецкие слова, но немцы стараются их правильно произносить. Вижу, вы просто не понимаете о чём речь.
-2 +0−2Константин Васин10:42:14
30/09/2013
4 +4−0Алексей Константинов10:40:13
30/09/2013
Серьезно? То-то у немцев, англичан и французов Москва Москвой называется. Звук в звук совпадение, чего уж там.
Я ни слова не сказал про географические названия. Но меня во всех странах старались называть правильно Константин, ни американцы, ни немцы не старались произносить на свой лад.
0 +1−1Константин Васин09:57:03
30/09/2013
Последняя серия просто прекрасна, особенно на фоне совершенно ужасной концовки Декстера и средненькой концовки Хауса. Все логично и мистер Уайт не изменил себе.
-3 +0−3Константин Васин08:18:29
30/09/2013
5 +5−0Дмитрий Ионов13:48:25
29/09/2013
Вообще-то в двух разных языках фонетика различается и на уровне озвучивания отдельных букв. Так, обе буквенные (в и уо) транскрипции английского W, строго говоря, ошибочны. И ваше Хайзенберг, и классическое Гейзенберг - это все приближения. Хотите говорить правильно - говорите Heisenberg .
И вообще говоря, я пожил в Германии и в США, в этих странах фонетика в одном конце страны отличается от фонетики в другом. В Баварии слова произносятся несколько по другому, чем в Северном Рейне Вестфалии. А в США легко отличить техаский акцент. И мне кажется я замечал разницу в произношении людей из Нью Йорка и Лос Анджелеса. Это вы видимо всю жизнь в России прожили и нигде не были, поэтому думаете, что произношение слова в рамках одного языка одно и тоже. И по большему счету Хайзенберг отличается от Heisenberg примерно также сильно как баварский немецкий и немецкого остальной части страны. А вот Гейзенберг это просто неграмотность человека, который первый упомянул эту фамилию в русском языке.
0 +2−2Константин Васин08:09:15
30/09/2013
5 +5−0Дмитрий Ионов13:48:25
29/09/2013
Вообще-то в двух разных языках фонетика различается и на уровне озвучивания отдельных букв. Так, обе буквенные (в и уо) транскрипции английского W, строго говоря, ошибочны. И ваше Хайзенберг, и классическое Гейзенберг - это все приближения. Хотите говорить правильно - говорите Heisenberg .
Да и американцы почему-то произносят немецкие фамилии правильно, хотя это не по их правилам транскрипции и идеально фонетически не произноситься. А у нас вечно свой "русский путь".
-3 +0−3Константин Васин00:51:50
30/09/2013
5 +5−0Дмитрий Ионов13:48:25
29/09/2013
Вообще-то в двух разных языках фонетика различается и на уровне озвучивания отдельных букв. Так, обе буквенные (в и уо) транскрипции английского W, строго говоря, ошибочны. И ваше Хайзенберг, и классическое Гейзенберг - это все приближения. Хотите говорить правильно - говорите Heisenberg .
Ну тогда почему бы не выбрать то написание, которое наиболее близко по звучанию к оригиналу? Мне кажется, что всёже Хайзенберг будет ближе чем Гейзенберг. И, например, можно было бы сделать как в Германии, они произносят французские и английские слова так как они звучат в оригинале.
1 2+1
Самые
^^^Наверх^^^Обратная связь