Как используются геопространственные «большие данные»

Геопространственные данные — это информация, так или иначе привязанная к конкретным местоположениям объектов. Обычно такие данные хранятся в виде географических координат и топологий. Число геопространственных данных растет ошеломляющими темпами, так как они преимущественно создаются не людьми, а широким спектром устройств. Их генерируют смартфоны, планшеты, спутники, цифровые камеры, а также радары, сенсорные сети и различные виды транспорта. По мере того, как тенденции интернет вещей и промышленного интернета набирают рост, количество геопространственных данных будет расти еще интенсивнее, чем сейчас.
Используются географические данные в географических информационных системах (ГИС) — информационных системах для ввода, хранения, поиска, анализа и вывода географически привязанных данных. Важнейшими элементами ГИС являются атрибуты, то есть, дополнительная информация, связанная с геопространственными данными. Также существует понятие т.н. слоёв данных — сочетания атрибутов и координат. К примеру, в роли слоя данных может выступать карта, на которую нанесены объекты. Анализ геопространственных данных иначе называют пространственной аналитикой. Он используется для получения ответов на вопросы о реальном мире — например, о текущей ситуации в заданной точке, векторе изменений, связанных с различными факторами, с моделированием и прогнозами.
Что дает геопространственный анализ организациям? Например, благодаря им можно визуализировать активность в социальных сетях во время глобальных событий — скажем, экологического кризиса. Сопоставление твитов, сообщений или блоггерской активности с географическим местоположением может помочь спасателям. Очевидно, что просто мониторить подобные источники данных силами операторов нереально — во время любого масштабного происшествия число репостов, сообщений, да и просто ложных новостей просто зашкаливает. Поэтому для организации спасательных работ необходимы сложные аналитические инструменты — примерно те же, что используют маркетологи в попытках опустошить карманы клиентов. Кстати, помогает подобный анализ и в борьбе с мошенничеством — многие готовы воспользоваться случаем и сообщить, что находились в районе бедствия, тогда как в действительности это не соответствует реальности...
Другой пример. Телекомы могут пользоваться геопространственными данными для того, чтобы регулировать отток пользователей. Те же социальные сети дают данные о том, что клиент переехал в другой район. В этом случае система наблюдает над доступностью услуг оператора в данной области и успевает предложить новый телефон или даже миниатюрную станцию сотовой связи до того, как рассерженный клиент решит сменить провайдера услуг. Немалую пользу из геопространственных данных извлекает энергетика. Выполняя пространственный анализ, компании рассчитывают, каким может быть пик энергопотребления исходя из географического положения и оборудования того или иного района. А самая развитая область применения геопространственных данных, это, конечно, реклама и маркетинг. Возможность предложить потребителю некие услуги именно тогда, когда он оказывается в непосредственной близости от магазина — лакомый кусок для маркетологов. Подобную рекламу активно используют уже многие торговые центры. Если, конечно, способны оплатить подобную экзотику — задача все-таки слишком ресурсоемкая для обычного бутика. Поэтому переживать о том, что ваш смартфон будет трезвонить вам о каждом магазинчике в шаговой доступности, еще рано.
Таким образом, спрос на обработку «больших геопространственных данных», достаточно велик. Предложения услуг в этой области тоже не стоят на месте. Одним из наиболее интересных стартапов, который в данный момент занимается потоками геопространственных даннымх, явлеется SpaceCurve. В SpaceCurve разработали кардинально новые способы параллельной обработки информации. Это даёт возможность индексировать сложные геопространственные полигоны в режиме реального времени, а также анализировать социальные и семантические графы на больших параллельных системах, что позволяет организациям принимать более обоснованные решения. Теоретически, технологии SpaceCurve доступны любому, кто может собирать какие-либо данные о положении мобильных устройств — у клиентов есть возможность создавать свое ПО, интегрируя его с возможностями SpaceCurve.
Еще один стартап, Loqate, разработал программные продукты для парсинга, стандартизации, проверки и очистки адресных данных со всего света. Каждому адресу присваиваются свои значения широты и долготы, что делает возможным его дальнейшее использование в ГИС системах. Эта возможность предоставляется компанией с 2012 года как облачный сервис, и разработчики также могут интегрировать эти данные в собственные приложения.
Таким образом, аналитические инструменты, отчасти опирающиеся на статистические методы анализа данных ГИС — топологии местности и координат объектов — выросли в сложные алгоритмы, обеспечивающие целый спектр различных применений. На сегодняшний день геоинформационные системы в связке с многочисленными данными от пользовательских устройств представляют собой мощный инструмент для маркетологов, бизнес-аналитиков, технологических компаний и многих других организаций.