10 Феноменальных ресурсов для открытых данных

10 Феноменальных ресурсов для открытых данных - манекены

Открытые данные являются частью более масштабной тенденции к менее жесткому, более открытому пониманию идеи интеллектуальной собственности, тенденции, которая набирает огромную популярность за последнее десятилетие. Открытые данные - это данные, которые были общедоступны и разрешены для использования, использования, использования и совместного использования с другими. Открытые данные являются частью открытого движения.

Помимо открытых данных, это метко названное открытое движение также включает в себя программное обеспечение с открытым исходным кодом, открытое аппаратное обеспечение, творческую работу с открытым контентом, открытый доступ к научным журналам и открытую науку - все привержены понятию, что содержание (включая необработанные данные из экспериментов) должно свободно распространяться.

Отличительной особенностью открытых лицензий является то, что у них есть копилефт вместо авторских прав. С copyleft, единственным ограничением является то, что источник работы должен быть идентифицирован, иногда с оговоркой, что производные работы не могут быть защищены авторским правом с более ограничительной лицензией, чем оригинал. Если второе условие в силе, успешная коммерциализация самой работы становится затруднительной, хотя люди часто находят много других косвенных, творческих путей коммерциализации.

Помните, что иногда работа, обозначенная как открытая, может не соответствовать принятому определению. Вы несете ответственность за проверку лицензионных прав и ограничений открытых данных, которые вы используете.

Люди часто путают открытые лицензии с лицензиями Creative Commons. Creative Commons - это некоммерческая организация, которая занимается поощрением и распространением творческих работ, предлагая правовую основу, с помощью которой разрешения на доступ и могут быть предоставлены, чтобы стороны совместного доступа были защищены от юридических рисков при создании и использовать работу и знания, которые были открыто разделены. Некоторые лицензии Creative Commons открыты, а некоторые явно запрещают производные работы и / или коммерциализацию.

В рамках более недавних открытых правительственных инициатив правительства во всем мире начали выпускать открытые правительственные данные. Правительства обычно предоставляют эти данные, чтобы их могли использовать волонтерские аналитики и гражданские хакеры - программисты, которые совместно работают над созданием решений с открытым исходным кодом, которые используют открытые данные для решения социальных проблем, - в целях содействия обществу в большой. В 2013 году страны «большой восьмерки» (Франция, США, Великобритания, Россия, Германия, Япония, Италия и Канада) подписали устав, обязующийся открывать данные, уделяя приоритетное внимание областям национальной статистики, результатам выборов, государственным бюджетам, и национальные карты.

Открытое правительственное движение способствует прозрачности и подотчетности правительства, поддерживает хорошо информированный электорат и поощряет участие общественности. Чтобы выразить это в вычислительных терминах, открытое правительство облегчает отношения чтения / записи между правительством и его гражданами.

Копание данных. gov

Данные. gov была запущена администрацией Обамы для обеспечения открытого доступа к неклассифицированным правительственным данным США. Данные. gov данные производятся всеми отделами исполнительной власти - Белого дома и всех отделов на уровне кабинета министров, а также наборами данных с других уровней управления. К середине 2014 года вы можете искать более 100 000 наборов данных, используя данные. gov поиск. Веб-сайт - это беспрецедентный ресурс, если вы ищете данные, полученные из правительства США, по следующим показателям:

  • Экономические
  • Экологические
  • STEM промышленность
  • Качество жизни
  • Правовые

Проверка Канада Open Data

Если вы посмотрите на веб-сайт Canada Open Data, то сильная приверженность страны данным в подавляющем большинстве очевидна. На веб-сайте Canada Open Data вы можете найти более 200 000 наборов данных. Среди 25 самых популярных предложений на сайте Canada Open Data представлены наборы данных, которые охватывают следующие показатели:

  • Экология
  • Гражданство
  • Качество жизни

Дайвинг в данные. гов. uk

Соединенное Королевство сошло на нет в открытом правительственном движении. Данные. гов. uk было начато в 2010 году, и к середине 2014 года было доступно только около 20 000 наборов данных. Как данные. gov, data. гов. uk также питается каталогом данных CKAN.

Хотя данные. гов. uk все еще играет в догонялки, у него есть впечатляющая коллекция карт обрядов Орднанса, достаточно старых - 50 лет и более - для защиты от авторских прав. Если вы ищете всемирно известные, доступные к использованию карты опроса, данные. гов. uk - невероятное место для вас. Помимо его звездных карт обзора, данные. гов. uk - полезный источник данных по следующим показателям:

  • Экологическая (наиболее распространенная тема в области статистики)
  • Государственные расходы
  • Социальные
  • Здоровье
  • Образование
  • Бизнес и экономические

Проверка данных Бюро переписи населения США

Перепись населения США проводится каждые десять лет, а с 2010 года данные были сделаны свободно доступными. Статистика доступна до уровня блока переписи, который в среднем составляет 30 человек. Данные демографии, предоставленные Бюро переписи населения США, могут быть чрезвычайно полезными, если вы занимаетесь маркетинговыми или рекламными исследованиями и должны ориентировать свою аудиторию в соответствии со следующими классификациями:

  • Возраст
  • Средний годовой доход
  • Размер домохозяйства < Пол или раса
  • Уровень образования
  • Знание данных НАСА

С момента своего создания в 1958 году НАСА обнародовало все свои неклассифицированные данные проекта. Он был в игре с открытыми данными настолько долго, что НАСА имеет массу данных! Наборы данных НАСА растут еще быстрее благодаря недавним улучшениям в области спутниковых и коммуникационных технологий. Фактически, НАСА теперь генерирует 4 терабайта новых данных о земле в день - это эквивалентно более чем миллиону файлов MP3.Многие из проектов НАСА накопили данные в диапазоне петабайт.

Открытый портал данных NASA называется данными.

Климат

  • Науки о жизни
  • Геология
  • Инжиниринг
  • Перехват данных Всемирного банка
  • Всемирный банк является международным финансовым учреждением, управляемым Организацией Объединенных Наций. Он предоставляет займы развивающимся странам для оплаты капиталовложений, которые приведут (на что надеются) к сокращению бедности и некоторому профициту, с тем чтобы страны-получатели могли погашать ссуды с течением времени. Поскольку сотрудники Всемирного банка должны принимать обоснованные решения о том, какие страны будут более склонны погашать свои кредиты, они собрали огромное количество данных о странах-членах. Они сделали эти данные доступными для общественности на странице «Открыть данные Всемирного банка».

Если вы ищете данные, чтобы поддержать свой аргумент в действительно интересной части данных-журналистике, которая поддерживается глобальной статистикой, Всемирный банк должен быть вашим исходным источником. Независимо от объема вашего проекта, если вам нужны данные о том, что происходит в развивающихся странах, Всемирный банк - это то место, где нужно идти. Вы можете использовать веб-сайт для загрузки целых наборов данных или просто просмотра данных в режиме онлайн. Вы также можете использовать API открытых данных Всемирного банка для доступа к тому, что вам нужно.

World Bank Open Data поставляет данные по следующим показателям (и многим и многим другим):

Сельское хозяйство и развитие сельских районов

Экономика и рост

  • Окружающая среда
  • Наука и техника
  • Финансовый сектор < Доход от бедности
  • Данные Всемирного банка также включают
  • микроданные
  • - выборочные обследования домашних хозяйств и предприятий в развивающихся странах. Вы можете использовать микроданные для изучения изменений в ваших наборах данных.

Знакомство с данными Knoema Knoema (произносится как «no-mah») является крупнейшим хранилищем публичных данных в Интернете. На платформе Knoema размещены ошеломляющие 500 + базы данных, в дополнение к 150 миллионам временных рядов

- 150 миллионов коллекций данных со значениями атрибутов с течением времени, другими словами. Кноема включает, но не ограничивается, все эти источники данных:

Данные правительства из промышленных стран Национальные данные из развивающихся стран Данные Организации Объединенных Наций

  • Международные данные организации
  • Корпоративные данные из глобальные корпорации
  • Knoema - выдающийся ресурс, если вы ищете международные данные по сельскому хозяйству, статистике преступности, демографии, экономике, образованию, энергетике, окружающей среде, продовольственной безопасности, внешней торговле, здравоохранению, землепользованию, национальной обороне, исследования и разработки, телекоммуникации, туризм, транспорт или вода.
  • Помимо того, что Knoema является невероятным источником данных, это многогранная платформа для задач. Вы можете использовать платформу Knoema для создания панелей, которые автоматически отслеживают все ваши любимые наборы данных. Вы можете использовать инструменты визуализации данных платформы, чтобы быстро и легко видеть ваши данные в виде таблиц или карт.Вы можете использовать Атлас данных Knoema для разрастания среди категорий и / или географических регионов и быстрого доступа к конкретным наборам данных, которые вам нужны. Как человек, вы можете загрузить свои собственные данные и использовать Knoema в качестве бесплатного хостинга. Помимо всего этого, Knoema даже предлагает рынок Knoema - место, где вы можете пойти, чтобы получить деньги за участие в проектах, ориентированных на данные.
  • Хотя многие данные Knoema довольно общие, вы все равно можете найти некоторые удивительно конкретные данные. Если вам трудно найти данные по определенной теме, вам может быть повезло найти ее на платформе Knoema. На рисунке показано, насколько конкретными могут быть данные Knoema.

Индекс записей насекомых в поиске Кноемы.

Очередь с данными Quandl

Quandl - это веб-сайт в Торонто, целью которого является поисковая система для числовых данных. Однако, в отличие от большинства поисковых систем, его база данных не создается автоматически пауками, которые сканируют веб-страницы. Скорее, он фокусируется на связанных данных, которые обновляются через

crowdsourcing

- обновляется вручную через кураторов человека, другими словами.

Поскольку большинство финансовых данных в цифровом формате, Quandl - отличный инструмент для того, чтобы оставаться в курсе новейшей деловой информатики. Как вы можете видеть, поиск Apple возвращает более 4 700 наборов данных из 11 разных источников с временными рядами на ежедневном, еженедельном, ежемесячном, ежеквартальном или годовом уровнях. Многие из этих результатов связаны с сельскохозяйственными данными Организации Объединенных Наций. Если вы ищете данные на Apple Computers, вы можете сузить область поиска, заменив термин поиска

Apple на аббревиатуру акций компании AAPL . Индекс записей Apple в Quandl search. База данных Quandl включает ссылки на более 10 миллионов наборов данных (хотя в ней используется щедрый показатель при объявлении того, что отличает один набор данных от другого). Quandl ссылается на 2. 1 миллион наборов данных ООН и многие другие источники, включая наборы данных в проекте открытых финансовых данных, центральные банки, организации по недвижимости и известные аналитические центры. Изучение данных Exversion

Моделирование после GitHub - облачная платформа, через которую программисты могут совместно делиться и просматривать код. Exversion стремится обеспечить такую ​​же совместную функциональность вокруг данных, которые GitHub обеспечивает вокруг кода. Платформа Exversion предлагает функции управления версиями и услуги хостинга, на которые вы можете загружать и предоставлять свои данные. Чтобы проиллюстрировать работу Exversion, представьте себе платформу, которая позволит вам сначала создать

fork

(или скопировать) набор данных, а затем внести необходимые изменения. Exversion будет там, чтобы отслеживать, что изменилось с исходного набора, и каждое изменение, которое вы ему делаете. Exversion также позволяет пользователям оценивать, просматривать и комментировать наборы данных.

Наборы данных, размещенные на платформе Exversion, предоставляются либо пользователем, либо создаются пауком, который обходит и индексирует открытые данные, чтобы сделать его доступным для поиска из одного интерфейса прикладного программирования (API).Как и GitHub, со свободной учетной записью пользователя все данные, которые вы загружаете в Exversion, являются общедоступными. Если вы готовы заплатить за учетную запись, вы можете создать свои собственные репозитории частных данных. Кроме того, с платной учетной записью вы можете поделиться своими данными с выбранными пользователями для совместных проектов. Сопоставление открытых пространственных данных OpenStreetMap OpenStreetMap (OSM) - это открытая альтернативная альтернатива коммерческим картографическим продуктам, таким как Карты Google и ESRI ArcGIS Online. В OSM пользователи создают, загружают или оцифровывают географические данные в центральный репозиторий.

Платформа OSM довольно надежна. Правительства и частные компании начали вносить вклад в общие наборы данных и извлекать их из них. Даже корпорации, большие, чем Apple, полагаются на данные OSM. В OSM теперь более 1 миллиона зарегистрированных пользователей. Чтобы проиллюстрировать, как человек может создавать данные в OSM, представьте, что кто-то связывает GPS-системы с мобильным телефоном с OSM-приложением. Из-за этого разрешения OSM может автоматически отслеживать маршруты дорог, пока человек путешествует. Позже этот человек (или другой пользователь OSM) может войти в онлайн-платформу OSM, чтобы проверить и маркировать маршруты.

Данные в OSM не хранятся в виде карт, а как геометрические и текстовые представления - точки, линии, многоугольники и аннотация карты - поэтому все данные OSM могут быть быстро загружены с веб-сайта и легко собраны в картографическое представление через настольное приложение.