обозначение структурированных и неструктурированных данных огромных объёмов и значительного многообразия, эффективно обрабатываемых горизонтально масштабируемыми программными инструментами, появившимися в конце 2000-х годов и альтернативных традиционным системам управления базами данных и решениям класса Business Intelligence.

В широком смысле о «больших данных» говорят как о социально-экономическом феномене, связанном с появлением технологических возможностей анализировать огромные массивы данных, в некоторых проблемных областях — весь мировой объём данных, и вытекающих из этого трансформационных последствий.

В качестве определяющих характеристик для больших данных традиционно выделяют «три V»:

  • объём (англ. volume, в смысле величины физического объёма),
  • скорость (velocity в смыслах как скорости прироста, так и необходимости высокоскоростной обработки и получения результатов),
  • многообразие (variety, в смысле возможности одновременной обработки различных типов структурированных и полуструктурированных данных);

в дальнейшем возникли различные вариации и интерпретации этого признака (Википедия).