Издатели перепишут книги для защиты от «пиратов»

18:09 17/06/2013 Наука и техника
Логотип проекта SiDim
Логотип проекта SiDim

Исследователи из Дармштадтского технического университета в Германии решили защитить электронные книги от незаконного копирования путем внесения изменений в их текст, сообщает TorrentFreak.

Каждую электронную копию одной и той же книги предлагается сделать уникальной, добавив в нее так называемые «текстовые водяные знаки». Если копия книги появится в общем доступе, по этим знакам можно будет отследить, кто именно из купивших книгу выложил ее в Сеть.

К «текстовым водяным знакам» разработчики методики относят, в частности, изменение порядка слов в предложении, иную разбивку на абзацы, изменение пунктуации и замену слов их синонимами. Например, словоunsympatheticможет быть заменено наnot sympathetic; оба слова означают «черствый» или «не способный к сочувствию».

«Текстовые водяные знаки» позволяют защитить книгу от копирования, не «привязывая» ее к пользовательскому аккаунту и не запрещая ее перенос с одного устройства на другое (например, с «читалки» на планшет), указывают авторы проекта.

Помимо необходимости правки авторского текста, у проекта есть и другие недостатки. Во-первых, «водяные знаки» предполагается вносить автоматическим способом, что не исключает ошибок. Во-вторых, «пират» перед размещением книги в Сети может добавить в текст книги собственные «знаки» — это сделает отслеживание затруднительным или вообще невозможным.

Инициатива была предложена в рамках проекта SiDiM (нем.Sichere Dokumente durch individuelle Markierung, «Защита документов с помощью индивидуальных меток»). Проект финансируется правительством Германии и получил поддержку немецкой Ассоциации издателей и книготорговцев.

Комментирование разрешено только первые 24 часа.

Комментарии(68):

1 +1−0Прохор Озорнин18:18:42
17/06/2013
0 +0−0Александр Антюфеев18:12:31
17/06/2013
То есть будут тысячи чуть-чуть различных вариантов одной книги...
А оригинал уничтожат?)
Собрать original и сжечь ! Проходили уже ...
0 +0−0Петр Долгоруков22:42:28
19/06/2013
0 +0−0Данил Дорош01:25:17
19/06/2013
Система вполне рабочая. Причем, в самом деле, можно даже слова не менять - достаточно вставить разное количество пробелов, где-то вместо тире поставить дефис, обрамленный пробелами.
Да, такую систему можно будет обмануть. Однако тут есть несколько "но": во-первых, издательство вам вообще не будет докладывать, что в тексте есть такая система защиты. Ее внедрят тихо и не заметно и пирату не станут докладывать, как именно его вычислили. Это разве что он в суде узнает.
Во-вторых, пиратство сегодня работает на энтузиазме - кто-то купил книгу в электронном виде и выложил на торрент. Потому что это одно движение мышкой. Это легко. Когда потенциальный пират будет знать, что для того, что бы выложить книгу, ему потребуется искать и качать какую-то программу, покупать несколько вариантов книг, сравнивать, искать ключи или портить текст книги и при этом он может только НАДЕЯТЬСЯ, что ключи будут потеряны при таком преобразовании. Пример - тут несколько наивных людей считают, что если они поменяют в тексте русскую е на английскую e, то дело в шляпе. Анализировать будет не бот, а человек, вооруженный программами. Он вручную найдет ключи и легко преобразует ваши буквы обратно на русские. И вот вас поймали.
Имея такой риск и некоторые сложности в выкладывании купленных книг, число желающих выложить книгу сократится. Людям будет просто ЛЕНЬ преобразовывать книгу перед выкладыванием.
насчет ЛЕНЬ ты ошибаешься. количество снизится - это да. но все равно найдется большое количество тех кто будет выкладывать. отчасти из-за чувства противоречия, отчасти ради того, чтобы чисто сломать код, отчасти просто бескорыстный народ есть
0 +0−0Ефремов Николай05:53:07
19/06/2013
0 +0−0Артём Попов09:31:24
18/06/2013
с видео сверхвысокого качества (то, что крутят в кинотеатрах) это давно делают, там куча меток, при том, что есть ещё и замороченая система защиты самого носителя и проэктора.

Цель - не "наказать" тех, кто скачал, а безошибочно определить того, кто допустил "слив". Как правило, это востребовано только со сверхдорогими профессиональными изданиями, которые поставляются по безналичной оплате, с регистрацией каждой партии/книги.
Возможно, Вы правы. Видимо, я не сталкивался со сверхдорогими профессиональными изданиями (даже не представляю себе их). А вот для подписи каких-нибудь достаточно объемных секретных материалов подойдет (да и используется уже давно, наверное).
0 +0−0Данил Дорош01:25:17
19/06/2013
Система вполне рабочая. Причем, в самом деле, можно даже слова не менять - достаточно вставить разное количество пробелов, где-то вместо тире поставить дефис, обрамленный пробелами.
Да, такую систему можно будет обмануть. Однако тут есть несколько "но": во-первых, издательство вам вообще не будет докладывать, что в тексте есть такая система защиты. Ее внедрят тихо и не заметно и пирату не станут докладывать, как именно его вычислили. Это разве что он в суде узнает.
Во-вторых, пиратство сегодня работает на энтузиазме - кто-то купил книгу в электронном виде и выложил на торрент. Потому что это одно движение мышкой. Это легко. Когда потенциальный пират будет знать, что для того, что бы выложить книгу, ему потребуется искать и качать какую-то программу, покупать несколько вариантов книг, сравнивать, искать ключи или портить текст книги и при этом он может только НАДЕЯТЬСЯ, что ключи будут потеряны при таком преобразовании. Пример - тут несколько наивных людей считают, что если они поменяют в тексте русскую е на английскую e, то дело в шляпе. Анализировать будет не бот, а человек, вооруженный программами. Он вручную найдет ключи и легко преобразует ваши буквы обратно на русские. И вот вас поймали.
Имея такой риск и некоторые сложности в выкладывании купленных книг, число желающих выложить книгу сократится. Людям будет просто ЛЕНЬ преобразовывать книгу перед выкладыванием.
0 +0−0Данил Дорош01:14:38
19/06/2013
-2 +0−2Олег Савицкий11:36:00
18/06/2013
Даже сравнивать не надо. Берешь НЕХ-редактор и меняешь "е" русское, на "е" латинское, "запятую" из кириллической раскладки на "запятую" из арабской. Машина поставившая защиту по алгоритму, не сможет опознать свою собственную защиту :)) Дело пяти секунд :))
Такой способ обхода антимата не работал даже в веб-чатах начала 2000-х
0 +0−0Bulat Ziganshin15:40:09
18/06/2013
0 +0−0Антон Тонков14:06:25
18/06/2013
я предлагаю в каждую книгу встраивать гранату. После прочтения объект авторского права уничтожается вместе с прочитавшим.
лучше делать из крем-брюле. после прочтения - съесть. заодно и читать быстро научатся :D
0 +0−0Антон Тонков14:06:25
18/06/2013
0 +0−0Bulat Ziganshin12:26:33
18/06/2013
кстати ответным шагом копирастов должен быть выпуск специальной версии книги/фильма для каждого зрителя-читателя. тогда услышав на форуме что Бимбо из Шина было 114 лет, можно будет сразу вычислить кто распространил свой вариант книги
я предлагаю в каждую книгу встраивать гранату. После прочтения объект авторского права уничтожается вместе с прочитавшим.
0 +0−0Bulat Ziganshin13:06:19
18/06/2013
0 +1−1Михаил Макаров01:56:44
18/06/2013
Ну-ну, пусть попробуют "изменение порядка слов в предложении, иную разбивку на абзацы, изменение пунктуации и замену слов их синонимами"... Авторы будут только приветствовать эти "мелочи"... И их адвокаты - тоже. Ударят, тассзть, копирайтом по копирастам. :)
ага, пчёлы против мёда. эта мера направлена на то чтобы авторы, как и остальные участники цепочки, больше зарабатывали
0 +0−0Bulat Ziganshin12:45:16
18/06/2013
0 +0−0Олег Савицкий11:29:04
18/06/2013
Артем, ну, не упирайся. Подумай логически: ну, разработают эти словари с аналогами/синонимами и что? Разбираем файл в НЕХ-редакторе и меняем символы с одинаковым написанием. Скажи, какими символами написано словосочетание "НЕХ-peдактop"? Воооот :)) После такой "редакции" компьютер поставивший защиту просто не найдет свои собственные метки :-))
это преобразование можно сделать программой. вот только и обратное тоже легко делается программой
0 +0−0Bulat Ziganshin12:41:30
18/06/2013
0 +0−0Петр Долгоруков20:10:43
17/06/2013
"набор синонимов/синтаксических аналогов" - см. выше. вот размеры отступов и пр, не влияющее на содержание - это книгу не разрушит. но легко убивается переформатированием текста. но вот наставит запятых вместо точек в конце предложений... или грамматических ошибок понадобавлять... тут уже придется программку писать, чтобы убирать копирайты :)
ну извините - не укладывается у меня в сознании (а больше в душе) современное т.н. "авторское право". как по мне: на концерты - пожалуйста, вход по билетам. песня спета - все, она для всех.
с фильмами так же - идите в кинотеатр. книги - ради бога, продавайте бумажные! хотите электронные - делайте чип/картридж и т.п. но в сети - тоже общие.
иначе - выложенное в сеть можно рассматривать как ПЕРЕСКАЗ той же книги. кстати - авторские права за пересказ принадлежат уже тому, кто пересказал.

все вышесказанное -ИМХО, выражает мою личную точку зрения и не претендует на какую-либо позицию и т.д., и т.п. ;)
Пётр, ты готов писать книги, песни, ещё что-то там, имеющие миллиарды слушателей, бесплатно делиться этим и жить в нищете? а то что-то мало перельманов на земле осталось...
0 +0−0Bulat Ziganshin12:39:47
18/06/2013
2 +2−0Петр Долгоруков18:57:03
17/06/2013
практически описанное тобой - это метод шифрования. однако хочу заметить - хорошая книга - это не только и не столько набор слов, пусть даже и синомимичных оригиналу. кто не верит - почитайте книгу в оригинале и в переводе на другой язык. пусть даже близкий. ну кто способен, кнчн. и получиться 2 разных книги по сути. так что такой подход будет хорошие книги убивать, выживет только бездарная ерунда. но смысл ее защищать-то...
это называется не шифрованием, а стеганографией
0 +0−0Bulat Ziganshin12:38:55
18/06/2013
0 +1−1Артём Попов18:29:35
17/06/2013
Как человек, имеющеий отношение к подобного рода защите, отвечу.
Несомненно. на каждую книгу будет конечно число "мест", причём, с разной разрядностью. вы же не отрицаете возможность ТРЕХ, а не двух, вариантов заменяемого текста? Допустим, у нас 20 трехразрядных мест в книге , сколько получается вариаций? 3^20, правильно. Но нам такое число не нужно, вместо этого разработаем алгоритм, который будет менять лишь часть радномно выбранных мест. Допустим, 5 мест. И не факт, что в другой книге, с которой вы будете сверять, будут ДРУГИЕ 5 мест, а не три из этой же и 2 других. Можете посчитать, сколько вам книг нужно сличить, чтобы найти все места с точностью 95% ?
а если разрядность (число синонимов/вариаций синтаксиса) будет 4, 5? На какой вариант, кстати, менять будете, с такой избыточностью событий полной группы можно легко сделать аналог CRC.
считать надо не количество мест, а кол-во способов замены. т.е. если в одном месте мы нашли что любовь заменяется на морковь, то во всё остальном тексте мы можем такую замену провести и усё. не заметить при сравнении N файлов можно только те замены, которые в них ни разу не применялись. причём если в одной книге такая замена уже была применена, и её заметили пираты, то им ничего не мешает во всех других файлах начать её применять автоматически, превентивно

что нам не нужно совпадение "crc" (а точнее контрольной суммы) - вам уже написали
0 +0−0Bulat Ziganshin12:29:34
18/06/2013
0 +1−1Asagiri Junko18:30:08
17/06/2013
Редкие дурачки. Это они предлагают продавать мне книгу с отличными от авторских правками? И делать эти правки для каждого купившего(для бестселлера - миллионы)? Немецкие ученые сражаются за лавры с британскими
вы не поверите, но 70 лет назад появились компьютеры, которые могут делать такую работу легко и просто
0 +0−0Bulat Ziganshin12:26:33
18/06/2013
1 +1−0Антон Тонков10:54:09
18/06/2013
при такой сложности шифровки появятся, например, сообщества "вольных пересказчиков". Эти сообщества будут в общих чертах пересказывать суть текста. В ветке уже говорилось - обнародованную информацию уже нельзя запереть, поэтому, лучше товарищам копирастам сосредоточиться на более удобных для клиента способах распространения.
кстати ответным шагом копирастов должен быть выпуск специальной версии книги/фильма для каждого зрителя-читателя. тогда услышав на форуме что Бимбо из Шина было 114 лет, можно будет сразу вычислить кто распространил свой вариант книги
0 +0−0Bulat Ziganshin12:23:27
18/06/2013
1 +1−0Антон Тонков10:54:09
18/06/2013
при такой сложности шифровки появятся, например, сообщества "вольных пересказчиков". Эти сообщества будут в общих чертах пересказывать суть текста. В ветке уже говорилось - обнародованную информацию уже нельзя запереть, поэтому, лучше товарищам копирастам сосредоточиться на более удобных для клиента способах распространения.
это 5, 5! теперь я понял, откуда в древней Греции взялись рассказчики наподобие Гомера
0 +0−0Bulat Ziganshin12:20:30
18/06/2013
0 +1−1Артём Попов18:29:35
17/06/2013
Как человек, имеющеий отношение к подобного рода защите, отвечу.
Несомненно. на каждую книгу будет конечно число "мест", причём, с разной разрядностью. вы же не отрицаете возможность ТРЕХ, а не двух, вариантов заменяемого текста? Допустим, у нас 20 трехразрядных мест в книге , сколько получается вариаций? 3^20, правильно. Но нам такое число не нужно, вместо этого разработаем алгоритм, который будет менять лишь часть радномно выбранных мест. Допустим, 5 мест. И не факт, что в другой книге, с которой вы будете сверять, будут ДРУГИЕ 5 мест, а не три из этой же и 2 других. Можете посчитать, сколько вам книг нужно сличить, чтобы найти все места с точностью 95% ?
а если разрядность (число синонимов/вариаций синтаксиса) будет 4, 5? На какой вариант, кстати, менять будете, с такой избыточностью событий полной группы можно легко сделать аналог CRC.
Артём, если известны какие параметры могут вообще модифицироваться, то пират может модифицировать их все (например привести все "согласен" к "не возражаю", все отступы в начале абзаца к одинаковой величине и т.д.)

т.е. расчёт должен быть на то что в каждом издательстве разрабатывают свои "точки бифуркации", при том в таком количестве, чтобы купив N случайно выбранных книг этого издательства, пират с вероятностью >50% не нашёл хотя бы одну из этих точек
0 +0−0CHIK Чики12:00:29
18/06/2013
5 +5−0Александр Бобров18:33:07
17/06/2013
Интересно, а если кто-то потеряет электронную книгу или её сопрут и выложат в общий доступ всё, что там есть, первого покупателя оштрафуют?
Ну - я сразу скажу что мой комп взломали, книгу скопировали и выложили в общий доступ))
0 +0−0Олег Савицкий11:32:00
18/06/2013
-2 +0−2Артём Попов09:22:22
18/06/2013
Причина вашего недопонимания - в что вы не понимаете сути формирования "стоимости" обьекта оборота. В вас сидит обывательский шаблон "если у другого не убудет, то это не кража". Вот вы в плоскую землю не верите? а в этот шаблон верите. Географию в школе учили, а экономику не учили.
Скажу честно: раньше книги скачивал на халяву, теперь покупаю. Из уважения к авторам, покупаю. С возрастом приходит понимание :))
0 +0−0Олег Савицкий11:29:04
18/06/2013
0 +0−0Артём Попов19:22:52
17/06/2013
для каждого языка будет разработан свой набор синонимов/синтаксических аналогов, которые будут минимально воздействовать на восприятие текста. ну, и, например, размер отступа между абазцами тоже может быть "ключом" )
Артем, ну, не упирайся. Подумай логически: ну, разработают эти словари с аналогами/синонимами и что? Разбираем файл в НЕХ-редакторе и меняем символы с одинаковым написанием. Скажи, какими символами написано словосочетание "НЕХ-peдактop"? Воооот :)) После такой "редакции" компьютер поставивший защиту просто не найдет свои собственные метки :-))
0 +0−0Олег Савицкий11:14:21
18/06/2013
-2 +0−2Артём Попов09:37:50
18/06/2013
да ради бога)
только, во-первых, это уже не книга, а "сырой текст" (довольно сложно читаемый теми, кто не привык к читалкам), во-вторых, в грошовых художественных книжках эту технологию будут использовать в последнюю очередь.
Я бы вам показал какой-нибудь из выпускаемых нами технических справочников на тысячу страниц, с сотнями рисунков, схем, формул и таблиц, и посмотрел бы, как бы вы его "сохранили в тхт" )
Ну, например, сохраню в пдф или джвю, потом Файнриадером в док и затем в фб2. Варианты есть, было бы желание :))
Самые
^^^Наверх^^^Обратная связь