Jupy Web Log

02.11.2008

Semantic Web и копирайт

Filed under: Semantic Web — jupy @ 2:50 пп
Tags: , ,

Если взглянуть на Semantic Web с точки зрения современного законодательства в области авторского права, то нельзя не отметить, что здесь существует серьезное противоречие. С одной стороны Semantic Web принципиально организован таким образом, чтобы обеспечить максимально быстрое, удобное и эффективное распространение информации. С другой стороны, как в рамках Semantic Web обеспечить защиту авторского права.

В обычном Web существует понятие страницы или документа. Страница распространяется по Сети как единое целое и у нее есть автор. Однако в Semantic Web документ — это совокупность RDF высказываний, каждое из этих высказываний имеет самостоятельное значение и может быть передано по Сети отдельно от других высказываний входящих в документ. Еще сложней обстоит дело с утверждениями, которые автоматически выводятся из других утверждений. Например:

Вася Пупкин создал документ в котором сказано, что «Вася» — сын «Пети». При этом Петя тоже создал документ в котором он утверждает, что «Петя» — сын «Коли». Вы закачиваете оба эти документа к себе на компьютер и ваш браузер автоматически выводит что «Вася» — внук «Коли». Возникает вопрос: кто обладает авторскими правами на это последнее утверждение? Вася? Коля? Вы? А может производитель браузера? Видимо в рамках сегодняшнего законодательства эта проблема вообще не решается. По крайней мере нет приемлемого решения, которое не приводило бы к полному абсурду.

Существует ли способ решить данную проблему? А может ее и не надо решать? Давайте посмотрим, а что вообще творится последнее время в сфере авторского права. Надо заметить, что здесь происходят весьма интересные события. Давно уже ни для кого не секрет, что в этой сфере человеческой деятельности скопилось множество проблем. Фактически, сегодня, авторское право просто не работает. Огромное количество людей копируют музыку, видео, тексты, изображения, не смотря на ограничения, которые нам всячески навязывают крупные компании, государственные органы и некоторые организации. В тоже самое время огромное количество авторов не может пробиться и донести результаты своего труда до потенциальных слушателей, зрителей, читателей. Огромные медиа корпорации монополизировали рынок и извлекают многомиллиардные прибыли как из авторов, так и из потребителей «интеллектуальной собственности».

Говорят, что если уровень доходов самых богатых слоев общества превышает уровень доходов самых бедных в 16 и более раз, то ситуация чревата социальными взрывами. Но если мы посмотрим на разницу в доходах среди профессиональных авторов «интеллектуальной собственности», то там этот разрыв будет отличаться в сотни раз. Причем, эта разница никак не связана с талантом и профессионализмом конкретного автора. Не секрет, что в силу, так называемого, «ухудшающего отбора» больше всего зарабатывают посредственности, тиражирующие ширпотреб для больших масс обывателей.

Однако, похоже, что времена начинают меняться. По всему миру активно стали создаваться «Пиратские» партии. Люди всячески противятся попыткам ограничить право копирования. Все более широкое признание получает идея о том, что информация должна быть открыта и максимально доступна для любого жителя планеты. Заметим, что все эти изменения связаны с развитием технологий. Новые технологии предоставили людям средства для эффективного обмена знаниями. И как только появились такие технические возможности, так стали набирать силу идеи о свободе распространения информации. Чем меньше барьеров на пути распространения информации, тем эффективней технический прогресс, тем больше личной свободы, и тем больше многообразия в окружающем нас мире. Semantic Web, в этом контексте, идет в русле с общей тенденцией.

Ссыли по теме:

Союз Пиратов лига творческой свободы

Сергей Капица о копирайте

Ричард Столмен «Право читать»

Реклама

6 комментариев »

  1. Интересная тема затронута и крайне актуальная, особенно в свете того, что в будущем объем передаваемой семантической информации вырастет на порядки.

    Но мне кажется в заметке подмешаны понятия ПАТЕНТОВАНИЯ и КОПИРАЙТА. Я против патентов, но за копирайт. Я хочу определять правила распространения любой моей заметки, исходного кода или даже этого комментария.

    В Вебе основным понятием является ресурс. Только ресурсы можно уникальным образом идентифицировать посредсвом URI и именно к ресурсу привязываются утверждения, в том числе копирайт. И, поэтому, большинство общепринятых онтологий содержат внутри себя копирайт. Wikipedia предоставляет свои статьи в соответствии с лицензией GNU Free Documentation License — это нормально и естественно.

    Поэтому, я считаю, что источник информации должен всегда сохраняться, чтобы можно было указывать степень его актуальности, доверия, правила распространения и вывода и пр. Например, часть публикуемых у меня на сайте ресурсов можно свободно распространяться, часть только при условии сохранения источника а часть, вообще не могут быть индексированы или агрегированны где бы то ни было, кроме специально оговоренных случаев. Это моё право и я буду за него бороться.

    комментарий от dulanov — 02.12.2008 @ 10:43 дп | Ответить

  2. В Semantic Web документ — это совокупность RDF высказываний, каждое из этих высказываний имеет самостоятельное значение и может быть передано по Сети отдельно от других высказываний входящих в документ.

    Должна быть возможность указать для ресурса, который содержит утверждения, можно ли их распространять, разьединять и пр.

    Вася Пупкин создал документ в котором сказано, что “Вася” — сын “Пети”. При этом Петя тоже создал документ в котором он утверждает, что “Петя” — сын “Коли”. Вы закачиваете оба эти документа к себе на компьютер и ваш браузер автоматически выводит что “Вася” — внук “Коли”. Возникает вопрос: кто обладает авторскими правами на это последнее утверждение? Вася? Коля? Вы? А может производитель браузера? Видимо в рамках сегодняшнего законодательства эта проблема вообще не решается. По крайней мере нет приемлемого решения, которое не приводило бы к полному абсурду.

    Я повторюсь, но закачка любой информации должна сохранять ссылку на её источник. Поэтому, закачав эти два утверждения мы всегда сможем ‘забанить’ тот или иной источник данных или наоборот поднять ему ‘уровень доверия’. Копирайт же выведенной информации зависит от копирайта исходных данных. Например, в мире open source существуют лицензия GNU GPL и BSD. Первая запрещает использовать иной копирайт кроме GNU GPL при доработке кода, а последняя нет.

    комментарий от dulanov — 02.12.2008 @ 10:52 дп | Ответить

  3. Затронутая тема безусловно интересна! Она актуальна особенно сейчас когда социальность ресурсов возрастает.

    Я так же за копирайт!

    Но патентование тоже весьма полезная вещь… но не в том виде, что есть сейчас.

    SW это открытая технология. Если мы запатентуем, какой нибудь объект, совокупность объектов онтологий и т.д. Так что теперь всем платить % за использование этой группы объектов?

    Тоже касается и семантических сервисов.

    комментарий от ontolog — 04.04.2008 @ 3:56 пп | Ответить

  4. Ресурс просто бомба. Взрывает крышу и заставляет поразмыслить о том, что раньше знал.

    комментарий от Стас — 09.28.2008 @ 5:02 пп | Ответить

  5. Я думаю вопрос авторского права не будет стоять вообще.
    Основой семантического веба думаешь станут странички от «Васи Пупкина» (как ты сказал) — нет конечно же.
    Я вообще не имею никакого доверия к этому Васе. И знать я его не знаю. И компьютерный агент который я буду использовать даже не будет использовать его странички по этой причине. Наверняка создадут единый банк данных для онтологий. Создадут чтобы в сети не плодились сотни версий онтоолгий от «Васи», от «Вани», от «Джоржа», чтобы можно было выявить кражи в особо крупных размерах. Но крупные игроки (Cyc, DBPedia, …) останутся на своих местах.

    Основа это (wikipedia,) dbpedia и другие мега онтологии, которые будут создаваться сообществом. Причём у них всех общая черта — бесплатность, отсутствие патентов и авторских прав.

    Конечно же буду создаваться закрытые источники знаний: биржевая торговля, политика, экономика, поп-звёзы, чёрный пиар, … Эти источники будут платными, патентованными, …

    Но поисковая система (яндекс, гугл, …) купит подписку на эти онтологии и они опять же станут бесплатными для людей — люди будут смотреть рекламу и тем самым оплачивать расходы поисковых систем обеспечивающих ревалентную выдачу.

    Вот это моё ИМХО.
    Если я создам онтологию и её импортируют в сотни других онтологий то я даже рад этому. Ведь все URI будут по прежнему указывать на меня.

    А если исходники моей онтологии скачали, разместили в другом месте и написали что её сделал не я а «Бен Неизвестный», то это преступление — но тут ничего нового или специфичного для онтологий нет.

    комментарий от tectep — 01.27.2010 @ 2:54 пп | Ответить

  6. Перечитал запись, подумал и понял, что выше я написал совсем не о том.
    Вопрос поднят очень важный.
    Я не разделил в своём посте выше права на «RDF-разметку документов», «онтологии» и «компьютерные агенты» (ПО которое использует онтологии и разметку).

    Предположим, что в мире (в сети) создающей силой является 1-2% людей (пользователей).
    В виду сложности разработки и поддержки «онтологий» и «компьютерных агентов» их особо воровать не будут, это как горы — не каждый осилит сдвинуть. Поддержку этих категорий продуктов смогут осуществить лишь истинные создатели.

    RDF-разметка документов является вещью несложной. Но даже её в явном виде сделать совсем непросто. Рассмотрю две крайности.
    Если взять учебник и перевести его в форму RDF-документа, привязав все термины в нём к концептам онтологии, то это уже «мультимедийная энциклопедия», а такие выпускаются на CD/DVD, их создатели имеют все права на такой продукт и получают деньги с продаж. Такие RDF-документы будут использовать те кто приобрёл диск.
    Если же заполнить форму регистрации на форуме/соцСети и в ней выбрать свои навыки, предпочтения, ФИО, адрес, а форум уже сам создаст нужный RDF-документ с описанием человека. То такая RDF-разметка неявная, человек о ней не знает. Такую разметку будет использовать форум/соцСеть и возможно поисковики, человек при этом ничего не будет получать.
    Если же кто-то просто создал отдельную страничку с RDF-разметкой и опубликовал её, то он знает о «праве на чтение» у всех людей и значит не против того, чтобы документ был прочитан.

    Я думаю онтологии и RDF-документы будут разрабатываться в узких предметных областях (сейчас это биология и медицина) и делаться это будет на заказ (или в битве за гранд), а широкого применения (когда любая страница в интернете будет считываться машиной вывода) не будет.

    комментарий от tectep — 01.29.2010 @ 2:01 пп | Ответить


RSS feed for comments on this post. TrackBack URI

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход / Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход / Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход / Изменить )

Google+ photo

Для комментария используется ваша учётная запись Google+. Выход / Изменить )

Connecting to %s

Блог на WordPress.com.

%d такие блоггеры, как: