Apache Hadoop - это программная структура, которая поддерживает распределенные приложения с интенсивным использованием данных по свободной лицензии. Это позволяет приложениям работать с тысячами вычислительно независимых компьютеров и петабайт данных. Hadoop был получен из документов Google MapReduce и Google File System (GFS).

Hadoop - это проект Apache верхнего уровня , который создается и используется глобальным сообществом участников, написанным на языке программирования Java. Yahoo! был крупнейшим спонсором проекта и широко использует Hadoop в своих компаниях.

Hadoop был создан Дугом Каттингом, который назвал его в честь игрушечного слона своего сына. Первоначально он был разработан для поддержки распределения для проекта поисковой системы Nutch.

IMG: