Серия
Анализ больших данных с помощью LINQ to HPC
на Ade Miller
"Большие данные" относятся к неструктурированным наборам данных, так большим, что их нельзя анализировать с помощью традиционных средств базы данных. Сегодня большие данные становятся более распространенными; она распространена не только в веб-трафике, но и в таких отраслях, как нефть и газ, финансы и производство. На основе проекта Dryad Microsoft Research LINQ to HPC является моделью программирования и распределенной средой выполнения для создания решений для анализа больших данных. Она выходит за рамки MapReduce и использует модель программирования LINQ и планировщик HPC для выполнения оптимизированных графов запросов в кластере компьютеров. В этом сеансе вы узнаете, как использовать LINQ to HPC в Windows Azure и локальном кластере Windows для создания аналитических приложений, которые имеют дело с большими данными. Эти приложения смогут масштабироваться до сотен компьютеров, не сталкиваясь с планированием, репликацией данных и сложностями сбоев узлов, как правило, связанными с программированием большой распределенной системы параллелизма данных.
"Большие данные" относятся к неструктурированным наборам данных, так большим, что их нельзя анализировать с помощью традиционных средств базы данных. Сегодня большие данные становятся более распространенными; она распространена не только в веб-трафике, но и в таких отраслях, как нефть и газ, финансы и производство. На основе проекта Dryad Microsoft Research LINQ to HPC является моделью программирования и распределенной средой выполнения для создания решений для анализа больших данных. Она выходит за рамки MapReduce и использует модель программирования LINQ и планировщик HPC для выполнения оптимизированных графов запросов в кластере компьютеров. В этом сеансе вы узнаете, как использовать LINQ to HPC в Windows Azure и локальном кластере Windows для создания аналитических приложений, которые имеют дело с большими данными. Эти приложения смогут масштабироваться до сотен компьютеров, не сталкиваясь с планированием, репликацией данных и сложностями сбоев узлов, как правило, связанными с программированием большой распределенной системы параллелизма данных.
Хотите оставить отзыв? Сообщить о проблеме можно здесь.