Аннотация: Алгоритмы и структуры для массивных наборов данных
Стандартные алгоритмы и структуры при применении к крупным распределенным наборам данных могут становиться медленными - или вообще не работать. Правильный подбор алгоритмов, предназначенных для работы с большими данными, экономит время, повышает точность и снижает стоимость обработки.
Книга знакомит с методами обработки и анализа больших распределенных данных. Насыщенное отраслевыми историями и занимательными иллюстрациями, это удобное руководство позволяет легко понять даже сложные концепции. Вы научитесь применять на реальных примерах такие мощные алгоритмы, как фильтры Блума, набросок count-min, HyperLogLog и LSM-деревья, в своих собственных проектах.
Приведены примеры на Python, R и в псевдокоде.
Основные темы:
вероятностные структуры данных в виде набросков;
выбор правильного движка базы данных;
конструирование эффективных дисковых структур данных и алгоритмов;
понимание алгоритмических компромиссов в крупно-масштабных системах;
правильное формирование выборок из потоковых данных;
вычисление процентилей при ограниченных пространственных ресурсах.
Автор/составитель | Меджедович Джейла, Тахирович Эмин |
Год выпуска | 2024 |
ISBN | 978-5-93700-250-1 |
Производитель | ДМК-Пресс |
Количество томов | 1 |
Количество страниц | 340 |
Переплет | Твёрдый переплёт |
Размеры | 245x175x25 мм |
Цвет | Зелёный |
Тип бумаги | офсетная (60-220 г/м2) |
Вес | 650 |
Язык | русский |
Бесплатная Доставка по Европе (EU)*
*Для заказов свыше 40, - евро Подробнее
Алгоритмы и структуры для массивных наборов данных
- Модель: MYSH5030617
- ISBN: 978-5-93700-250-1
- Наличие: