Аннотация: Сбор данных в Интернете на языке R
Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём производим всё больше данных. Но гораздо чаще случается так, что данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, заметках в социальных сетях, логах серверов и т.п. Прежде чем начать работать с такими данными, их необходимо собрать и сохранить в пригодном для анализа виде. Решению этих вопросов и посвящена данная книга.
Основной материал книги разделён на две части. В первой части дано краткое введение в R - описание среды разработки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из социальных сетей. Также рассмотрены необходимые технические вопросы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. Завершается рассказ созданием карт на основе собранных данных.
Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете.
| Автор/составитель | Храмов Дмитрий Александрович |
| Год выпуска | 2017 |
| ISBN | 978-5-97060-459-5 |
| Производитель | ДМК-Пресс |
| Издательство | ДМК-Пресс |
| Количество томов | 1 |
| Количество страниц | 282 |
| Переплет | Мягкая обложка |
| Размеры | 200x141x13 мм |
| Цвет | Белый |
| Тип бумаги | офсетная (60-220 г/м2) |
| Тип крепления | клеевое (КБС - клеевое бесшовное соединение) |
| Наличие иллюстраций | рисунки |
| Тип иллюстраций | черно-белые |
| Формат | 60x88/16 (140x205 мм) |
| Тираж | 200 |
| Стандарт | 20 |
| Вес | 290 |
| Язык | русский |

