Константин Васин№587881 „28“

1 2+1
8 +15−7Константин Васин04:25:50
28/09/2013
3 +11−8Domkrat21:24:37
27/09/2013
Ссылка на ru.wikipedia.org

Выпирает ваше незнание физики.
Вообще-то ещё Айнштайн, а не Эйнштейн, Зебастиан, а не Себастиан Феттель, и тут абсолютно правильно Хайзенберг, он в сериале говорит Хайзенберг.

Выпирает ваше незнание иностранных языков.
2 +2−0Константин Васин20:20:54
02/10/2013
0 +0−0Дмитрий Егоров20:01:44
02/10/2013
Если Вы так хорошо в этом разбираетесь и критикуете, то предложите пожалуйста собственную программу распознавания. Или только в теории сильны?
Я работаю в другой области, но когда получал мастера в университете, то пересекался с человеком, который сделал систему распознавания речи для гугла. Зачем мне предлагать, если уже гугл предложил? Просто я написал это, чтобы люди не зазнавались и не думали, что Яндекс лучше.
1 +1−0Константин Васин19:29:32
02/10/2013
0 +1−1Petr Gusakov19:07:31
02/10/2013
Слава богу, что кто-то этим вообще занимается.
Этим занимается гораздо больше русский людей, чем может показаться.
1 +1−0Константин Васин18:52:16
02/10/2013
0 +0−0владимир николаев18:20:40
02/10/2013
а распознать русский язык и речь весьма сложнее чем английский, так что тут яндекс гораздо впереди по алгоритмам, а общие идеи - это вторично.
Алгоритм распознавания речи состоит из двух важных частей: языковая модель и акустическая модель. Языковая модель в русском языке немного сложнее, но это совсем не проблема, просто используются тот же алгоритм, но с большим количеством данных. А акустическая модель не отличается существенно в различных языках. Не стоит говорить, что яндекс впереди по алгоритмам, они используют зарубежные наработки. А акустическая модель, на сколько я понимаю, у яндекса реализована методами 10летней давности, в то время как Google использует самые современные методы.
0 +0−0Константин Васин12:55:15
26/09/2013
0 +2−2Andrei Konyaev08:42:57
26/09/2013
О, старый добрый переход на личности. Да вы, батенька, м*дак. Пожалуюсь-ка на вас модераторам. Ну чтоб мир лучше сделать
В комментарии не было ни слова оскорбления, была просто констатация фактов, видимо вы просто боитесь, что люди узнают о вашем непрофессионализме. Вы хотя бы прочитали литературы немного по теме, по которой статьи пишете, сначала чушь писали во время презентации Apple про сборщики мусора и 64бита, теперь полное отсутствие знания в HCI.
0 +0−0Константин Васин14:08:05
26/09/2013
1 +1−0Джейн Остин13:56:54
26/09/2013
Я имею ввиду браузерные гуглокарты.
Гугл недавно хвастался, что у них сейчас толи 20%, толи 30% сотрудников без образования.
0 +0−0Константин Васин22:25:32
02/10/2013
0 +0−0владимир николаев22:16:57
02/10/2013
ну нет же, не используются те же самые модели.
почему тогда есть еще работа у живых переводчиков?
если для вас это все так просто, лишите их работы, и денег заодно добудете, и немалых.
модели нужно, так сказать, затачивать под конкретную задачу (что яндекс и сделал), потому как правильно определить смысловой контекст - это весьма непростая задача.
но, повторюсь, если для вас все эти вопросы просты, сделайте англо-русский переводчик, а то у меня не получается немножко.
Я говорил про распознавание речи, вы зачем-то перешли про переводчик. В распознавании речи языковые модели служат для совсем другой цели нежели в машинном переводе. Есть слова которые звучат абсолютно одинаково. Например, есть here и hear. И языковые модели нужны чтобы при распознавании различить "Do you hear me?" потому что если бы использовалась только акустическая модель, то компьютер не смог бы различить между "Do you hear me?" и "Do you here me?". Распознавание речи существенно более простая задача чем машинный перевод, с машинным переводом никогда не работал, ничего не могу сказать. Ну если вы хотите сделать машинный переводчик, то вам нужно в первую очередь изучить работы от Franz Och.
0 +0−0Константин Васин21:08:03
02/10/2013
0 +0−0владимир николаев20:56:48
02/10/2013
Я тоже немного знаком с программированием, я думаю, что в яндексе все-таки сами разрабатывают алгоритмы.
Языковая модель в русском языке ГОРАЗДО сложнее.
Я не верю что " у нас было 10 групп и все справились", вы чего-то не договариваете, значит у вас были готовые алгоритмы.
Я думаю, что вы не владеете предметом.
Ну и бред вы несёте. Каким образом допустим модель Найзер-Ная становится сложнее если применить её к русскому языку?

Я же сказал, у нас были на руках публикации (похоже вы не знаете, что алгоритмы описаны в публикациях), программировали с нуля, данные для обучения и тестирования были подготовлены (но их не сложно подготовить, но затратно по времени).

Вот что мы выполнили в этом курсовом проекте:

1) языковая модель Kneser-Ney;
2) акустическая модель Mixture of Gaussian with pulled covariance, для обучения параметров был использован EM;
3) выравнивание - стандартное для этого случая динамическое программирование;
4) само распознавание было закодено как beam-search на лексиграфическое дереве (плохо помню термины тут, надеюсь не ошибся, было это очень давно).
0 +0−0Константин Васин20:28:52
02/10/2013
0 +0−0Дмитрий Егоров20:01:44
02/10/2013
Если Вы так хорошо в этом разбираетесь и критикуете, то предложите пожалуйста собственную программу распознавания. Или только в теории сильны?
И Вы немного неграмотно выразились, дело в том, что исследование в Computer Science занимаются разработкой алгоритмов, и уже программисты потом просто программируют эти алгоритмы. Работа исследователей на много более сложная чем работа программистов. Фактически каждый может скачать научные статьи (практически всё находится в открытом доступе), и запрограммировать алгоритмы оттуда, но далеко не каждый может разработать эти алгоритмы. Когда я был студентом, у нас студенческие проекты были написать программы распознавания речи по готовым публикациям, у нас было 10 групп и все справились, так что эта задача достаточно простая.
0 +0−0Константин Васин21:39:19
02/10/2013
-1 +0−1владимир николаев21:31:53
02/10/2013
очень простым : нужно учитывать гораздо больше словоформ, и гораздо больше контекстов.
как-то странно вы выражаетесь - динамическое программирование в п.3 - остальные пункты вы делали в строчку, что-ли? без разбиения на подзадачи?
И в каком университете дают мастера?
Нет, я вам не верю. Кажется, вы тут просто работаете.
Я делал мастера в Германии, затем получил phd в США.

Мне вам что ли всё подробно описывать нужно было? Я же уже 10 раз написал, используются теже самые модели просто словари больше и нужно больше данных чтобы составить языковую модель. Но модели теже самые, нет ничего сложного, чтобы собрать больше текста. Человек с которым я эту тему обсуждал сказал мне, что в финском с морфологией ещё хуже и они просто используют больше текстов, чтобы выучить языковую модель.

Я так оформил по пунктам, потому что знающему человеку этого на 100% хватило бы понять что было использовано в каждом компоненте.
0 +0−0Константин Васин12:58:44
26/09/2013
0 +2−2Andrei Konyaev08:42:57
26/09/2013
О, старый добрый переход на личности. Да вы, батенька, м*дак. Пожалуюсь-ка на вас модераторам. Ну чтоб мир лучше сделать
Просто у меня как у человека, который потратил сотни часов на изучения темы кровь из глаз идёт, когда я читаю ваши технические статьи. Сейчас в слепую пишу, ослеп полностью после этой. Ребята с The Verge хотя бы используют терминологию из книг по HCI, видно что они подготовлены, например.
0 +1−1Константин Васин09:57:03
30/09/2013
Последняя серия просто прекрасна, особенно на фоне совершенно ужасной концовки Декстера и средненькой концовки Хауса. Все логично и мистер Уайт не изменил себе.
0 +2−2Константин Васин08:09:15
30/09/2013
5 +5−0Дмитрий Ионов13:48:25
29/09/2013
Вообще-то в двух разных языках фонетика различается и на уровне озвучивания отдельных букв. Так, обе буквенные (в и уо) транскрипции английского W, строго говоря, ошибочны. И ваше Хайзенберг, и классическое Гейзенберг - это все приближения. Хотите говорить правильно - говорите Heisenberg .
Да и американцы почему-то произносят немецкие фамилии правильно, хотя это не по их правилам транскрипции и идеально фонетически не произноситься. А у нас вечно свой "русский путь".
0 +4−4Константин Васин15:02:21
28/09/2013
7 +9−2Domkrat11:51:47
28/09/2013
Фонетику иностранного языка(английского и элементарные примеры других) я знаю, и она здесь не причем. Может тогда начнем все имена на иностранный лад произносить?

Алэкзандр, Анастэйша, Аннет, Майкл?

Здесь можно глубоко копать, имена географических локаций, научные термины и т.д.

Выпирает ваша глобализованность.
Просто я не вижу совершенно никакого смысла искажать фамилии, которые фонетически абсолютно правильно могут быть перенесены на русский язык. Подобные искажения в основном происходят из-за элементарной неграмотности людей, которые первыми употребляли фамилии. Читал недавно хорошую книжку про советских филологов, тогда было даже такое, что люди изучавшие английский/немецкий/французских в жизни не видели ни одного носителя языка, из-за этого так и получаться стало.
-1 +0−1Константин Васин04:23:24
26/09/2013
5 +10−5Andrei Konyaev16:53:43
25/09/2013
Вообще-то, молодой человек, в редакции четыре Серфуса. И мы их не в магазине тестили, как вы, а в боевых условиях - писали онлайн-трансляцию презентации второго Серфуса. Так что минус вам в карму и порицание
Вы тестировали планшеты в боевых условиях ноутбуков и гордитесь этим? Неплохо было бы нанять технического редактора с настоящим образованием.
-1 +0−1Константин Васин10:49:24
30/09/2013
2 +2−0Алексей Константинов10:45:52
30/09/2013
Единственно верный принятый в России перевод имени собственного. Не понравится разве что выскочкам, стремящимся выпендриться своим знанием английского языка. Та же история с броуновским движением, которое подобные выскочки брауновским стремятся называть.
"Выпендриться знанием" может быть произнесено только необразованным быдлом, которое само ничего изучить не может, а когда другие больше знают, то их это просто бесит. Вы такой?
-2 +0−2Константин Васин15:53:04
30/09/2013
1 +1−0Антон Антонов15:14:44
30/09/2013
ну тогда вы свою степень не заслужили
Забавные вы все тут, на самом деле школьник из Волгограда, в жизни за границей не был. Всё что вам писал нагуглил за 10 минут, а вы повелись. Да и могли бы сразу додуматься, что будет делать в обсуждении статьи на ленте.ру человек с приличным образованием?
-2 +0−2Константин Васин10:42:14
30/09/2013
4 +4−0Алексей Константинов10:40:13
30/09/2013
Серьезно? То-то у немцев, англичан и французов Москва Москвой называется. Звук в звук совпадение, чего уж там.
Я ни слова не сказал про географические названия. Но меня во всех странах старались называть правильно Константин, ни американцы, ни немцы не старались произносить на свой лад.
-2 +1−3Константин Васин17:08:29
02/10/2013
Да небось яндекс что-то простое для акустических моделей использовал, небось какие-нибудь смеси Гауса, иначе не объяснить такой низкий процент распознавания по нынешним меркам. Гугл и MS сейчас используют deep learning, яндексу похоже до этого далеко.
-2 +0−2Константин Васин10:58:22
30/09/2013
2 +2−0Алексей Константинов10:57:58
30/09/2013
Английский, немецкий, испанский и болгарский. А что?
Откуда вы болгарский знаете?
1 2+1
Самые
^^^Наверх^^^Обратная связь