Баннер
Баннер
12.05.2014 11:17

Мир, возможно, изменится

Автор  Игорь Лёвшин
Оценить
(0 голоса)

Я продолжаю думать, что в индустрии HPC именно сейчас уже творятся удивительные вещи. Опять потихоньку, не на телеэкранах, не на первых полосах онлайновых изданий. Не сравнить, во всяком случае, с такими звездами-перфомансами, как «Геном» или «3D-принтер».

Большие Данные и Высокопроизводительные Вычисления держались как-то больше порознь – разные издания, разные конференции. Хотя, казалось бы, как же так? Как же обрабатывать петафлопсы данных без суперкомпьютера приличествующей таким цифрам мощности?

И что же, петабайты памяти мощнейших суперкомпьютеров – неужели в них хранятся не Большие, а маленькие данные?

Все имеет объяснение. У одних в разговоре через слово InfiniBand, у других – Hadoop. Или другое: дело в Больших Друзьях. Аналогия из далекой области: жили поэты, писали похожие, в общем, стихи. Но входили в разные, не слишком дружественные между собой компании, в результате в историю культуры они попали под совсем разными «-измами». Лучшие друзья производителей суперкомпьютеров – государственные фонды. Большие Данные частенько кормятся с руки Большого Бизнеса: большим есть что анализировать и оптимизировать. Чья рука щедрее?

Intel, выпуская новый процессор Xeon E7 v2, говорит о том, что он прежде всего предназначен для Больших Данных корпораций, бизнес-аналитики (он работает с большим количеством памяти на узел), но может оказаться полезен и для HPC. А не наоборот.

Но Большой Бизнес – это не только нефть и глобальные сети супермаркетов, это еще и Google, Amazon и Facebook. И все они давно занимаются не только своими «прямыми обязанностями». Google, например, приделывает к автомобилям такую электронику, что они едут сами, без водителя. Это милые крайности, но эти компании уже говорят о том, что они не по части Big Data, а по части Data Science. Это даже не умение обращаться с Большими Данными, выполняя какую-то конкретную задачу, а понимание того, для чего данные можно в принципе использовать, какие принципиально новые задачи и принципы обращения с данными возникают.

Многие идеи впечатляют почти полным разрывом с тем, что казалось уже законом, оплаченным потом, если не кровью тех, кто имел профессию Computer Science.

И вот те, кто, возможно, скоро будет писать в своем резюме «Профессия: Data Science» (пока, кажется, профессия такая официально не появилась), смеют говорить «если отказаться от классических транзакций», «если отказаться от согласованности данных». И не только говорят, но и отказываются.

Разговор с Аркадием Борковским, одним из идеологов современного Яндекса, впечатлил именно замахом на неслыханное: в компании собираются перенести свой опыт анализа данных на все существующие в мире данные вообще – если это Большие Данные: треки частиц в коллайдере; покупки в некоторой сети супермаркетов в 100 странах, да мало ли что еще. Если это произойдет, мир изменится. Это Яндекс. Даже страшно представить, что за проекты роятся в головах создателей Google.

Да, но ведь бизнес Яндекс, Google, Amazon, Facebook выжил благодаря тому, что для своих грандиозных задач они научились использовать самые скромные «железные» средства — недорогие серверы. Очищенные от всего лишнего, но в целом вполне стандартные. Но эти современные монстры стимулируют рынок развивать доселе невиданные изысканные технологии в микроэлекторнике. Пока — да.

С заместителем директора «НИИ «Квант» мы поговорили о чипах новой идеологии — Tilera и Micron. Последние и процессорами не назовешь: это «умная» память. Она настолько умна, что поиск в себе, в памяти, ускоряет на порядки.

В том случае, если ты знаешь, что надо искать: скажем, известные куски изображений, речи, программного кода. Чипы фирмы Tilera этому тоже обучены, но они еще и полноценные процессоры.

А если окажется, что экономически оправдано вести поиск на пока экзотических, недешевых, но зато необыкновенно эффективно решающих задачи, типичные для того же Google? Десятки миллионов устройств будут куплены немедленно, а это значит, что массовые продажи позволят снизить цену и вложить деньги в разработку новых версий. В считанные годы маргиналы ворвутся в мейнстрим. Мир изменится.

Не разойдутся ли от этого вновь пути HPC и Big Data? Ведь новые устройства будут быстро осуществлять поиск в огромных массивах памяти, но они же не создавались для того, чтобы решать системы уравнений? На них же не рассчитаешь турбулентные потоки, геологические пласты, с их помощью не сделаешь неслыханно точный прогноз погоды. Возможно, появятся в большом количестве системы далеко не универсальные, и мир больших машин, до этого относительно гармоничный, развалится на два мира: систем для поиска в колоссальных массивах памяти и систем для быстрого выполнения однотипных операций. Вслед за потребителем разделятся, возможно, и производители: многие расстанутся с бизнесом, без которого, казалось, немыслимы — как Apple рассталась с амбициями производителя «маков» в угоду любителям «таблеток». Конечно «искатели» и «решатели» останутся вместе, появятся удобные интерфейсы для их взаимодействия. Но ведь системный блок и монитор тоже вместе, но на этом их родственные связи заканчиваются. Получается, что наметившаяся в последнее время конвергенция HPC и Big Data под угрозой?

«Умная память» и фильтрующие информацию чипы Tilera пока что подразумевают программиста, знающего, как формализовать объект поиска. Пока они обращаются к самому что ни на есть естественному интеллекту. Между тем Искусственный Интеллект собирается, похоже, взять реванш за десятилетия презрения. Есть признаки того, например, что нейронные сети не только преуспеют в предсказании олимпийских медалистов в фигурном катании, но и отвоюют себе территорию в научных задачах, в промышленности и в бизнесе. Нейронная сеть, тестирующая авиационные двигатели, – это уже как минимум повод призадуматься.

Как мы уже писали в журнале, нейронные сети (а также генетические алгоритмы и прочие «интеллектуальные» технологии) активно опробуются компаниями-монстрами, выросшими на поиске, соцсетях и интернет-продажах. До этого такие технологии поддерживались больше государственными структурами, изредка «классическим» бизнесом (банками), позволявшим себе поэкспериментировать. Если потребность в них со стороны Google, Amazon и Facebook станет реальной, производители откликнутся исследованиями и новыми версиями, что в свою очередь стимулирует их использование – пойдет лавинный процесс. И мир немного изменится.

Пока можно смело сказать, что производители откликнулись на потребности графостроителей. Среда Intel Graph Builder, построенная поверх Titan: Distributed Graph Database с открытым кодом, помогает визуализировать и анализировать гигантские графы, с которыми имеют дело компании, строящие свой бизнес вокруг соцсетей (и не только они). Аналогичные среды есть у Amazon и Netfix. Странное сочетание «графовая база данных» прозябало на обочине сознания IT-специалиста. Сетевые, графовые базы данных стремительно становятся актуальными. А захватившие, казалось навсегда, мейнстрим бизнес-приложений реляционные СУБД со своим SQL теснят (хотя часто и дополняют) СУБД нового типа. «NoSQL» становится модным словечком.

Все это, конечно, лишь прогнозы, не претендующие на высокопроцентную реалистичность. Но их задача — не просто развлечь досужего читателя, а напомнить о том, что надо быть готовым к неожиданным поворотам. Стратегия «догнать и перегнать» может не сработать, она слишком инерционная для нынешнего времени. Технологии IT развиваются не всегда линейно. В быстро изменяющемся мире тяжело приходится тем, кто велик и неповоротлив. Легче тем, кто начинает с нуля, но не только им. Бывает, что удается перескочить через промежуточные фазы развития. Тем более в ситуациях, когда в качестве нового всплывает хорошо или плохо забытое старое. А уж чего-чего, а этого у нас хватит не на одно поколение.

Изменено 12.05.2014 11:26

Добавить комментарий


Защитный код
Обновить

Новости

Календарь материалов

« Июня 2017 »
Пн Вт Ср Чт Пт Сб Вс
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30