Соображения безопасности с большими данными

Соображения безопасности с большими данными - манекены

В то время как компании очень обеспокоены безопасностью и управлением своими данными в целом, инициативы в области больших данных связаны с определенными сложностями и непредвиденными проблемами, с которыми многие компании не готовы справиться.

Часто большой анализ данных ведется с использованием огромного массива источников данных, который может исходить из многих неподтвержденных источников. Кроме того, ваша организация должна знать правила безопасности и управления, которые применяются к различным крупным источникам данных.

Ваша организация может рассчитывать на то, чтобы определить важность большого количества новых данных, полученных из разных неструктурированных или полуструктурированных источников. Имеются ли ваши недавно полученные данные, содержащие личную информацию о здоровье (PHI), которая защищена Законом о подотчетности и переносимости медицинского страхования (HIPAA) или личной идентификационной информацией (PII), например именами и адресами?

Безопасность - это то, о чем вы никогда не можете действительно расслабиться, потому что современное состояние постоянно развивается. Сочетание безопасности и управления обеспечит ответственность всех сторон, вовлеченных в развертывание управления информацией.

Управление безопасностью информации должно рассматриваться как общая ответственность всей организации. Вы можете внедрить все новейшие технические средства безопасности и по-прежнему сталкиваться с угрозами безопасности, если ваши конечные пользователи не имеют четкого представления о своей роли в сохранении всех данных, которые они работают с безопасными.

Оцените риск для больших данных

Большие данные становятся важными для руководителей бизнеса, которые пытаются понять новые направления продукта и требования клиентов или понимать здоровье своей общей среды. Однако, если данные из разных источников приводят к рискам безопасности в компании, непреднамеренные последствия могут поставить под угрозу компанию.

Вам нужно много подумать, и понимание безопасности - это движущаяся цель, особенно с введением больших данных в ландшафт управления данными. В конечном счете, образование является ключевым.

Риски, скрывающиеся в больших данных

В то время как безопасность и управление - это проблемы корпоративной сферы, на которые компании должны сосредоточиться, некоторые различия характерны для больших данных. Например, если вы собираете данные из неструктурированных источников данных, таких как сайты социальных сетей, вы должны убедиться, что вирусы или фиктивные ссылки не захоронены в контенте. Если вы сделаете эти данные частью своей аналитической системы, вы можете подвергнуть свою компанию риску.

Кроме того, имейте в виду, каков будет исходный источник этих данных.Неструктурированный источник данных, который может иметь интересный комментарий о типе клиента, который вы пытаетесь понять, может также включать посторонний шум. Вам нужно знать природу этого источника данных.

Были ли данные проверены? Безопасно ли и защищено от вторжения? Например, более авторитетные сайты социальных сетей будут внимательно следить за шаблонами вредоносного поведения и удалять эти учетные записи до того, как они нанесут ущерб. Для этого требуется уровень сложного большого анализа данных, на который способны не все сайты.

Большие возможности защиты данных

Некоторые эксперты считают, что разные типы данных требуют различных форм защиты и что в некоторых случаях в облачной среде шифрование данных может быть, по сути, чрезмерным. Вы можете зашифровать все. Вы можете шифровать данные, например, когда вы пишете их на свой собственный жесткий диск, когда вы отправляете его поставщику облака, и когда вы храните его в базе данных облачного провайдера.

Шифрование всего по-разному уменьшает вашу экспозицию; однако шифрование создает штраф за производительность. Например, многие эксперты советуют управлять вашими собственными ключами, а не позволять провайдеру облака делать это, и это может усложниться. Слежение за слишком большим количеством ключей может стать кошмаром.

Управление хранением, архивированием и доступом к ключам затруднено. Чтобы облегчить эту проблему, сгенерируйте и вычислите ключи шифрования по мере необходимости, чтобы уменьшить сложность и повысить безопасность.

Вот некоторые другие доступные методы защиты данных:

  • Анимация данных : Когда данные анонимизированы, вы удаляете все данные, которые могут быть однозначно привязаны к индивидууму. Хотя этот метод может защитить некоторую личную идентификацию, а значит и конфиденциальность, вам нужно быть очень осторожным в отношении объема информации, которую вы лишаете.

  • Tokenization: Этот метод защищает конфиденциальные данные, заменяя его случайными знаками токенов или псевдонимами, которые ничего не значат для тех, кто получает несанкционированный доступ к этим данным. Этот метод уменьшает вероятность того, что воры могут что-либо сделать с данными.

  • Элементы управления облачной базой данных: В этом методе элементы управления доступом встроены в базу данных для защиты всей базы данных, чтобы каждая часть данных не нуждалась в зашифровке.