понедельник, 19 ноября 2012 г.

Обзор книги: Steve Holden: Python для анализа данных (Перевод)


Python for Data Analysis; Wes McKinney. O'Reilly Media, October 2012
Эта книга является давно ожидаемым дополнением к священному писанию Python, и её стоит прочитать каждому, кто связан с анализом данных. C самой первой главы это чёткое и и качественное объяснение того, как можно использовать Python для этих целей. Автор подразумевает, что Python используется в качестве "готового" языка, так что в книжке не рассказывается о том, как реализовать аналитические методы на Python, вместо этого на практических примерах демонстрируется как использовать уже существующие, доступные, мощные инструменты.
После нескольких коротких мотивирующих примеров Вы прочитаете одно из наиболее ясных изложений преимуществ iPython, которое я только читал. Прочитав эту главу я не только убедился в этих преимуществах, но и завёл себе аккаунт на NotebookCloud*, который, мне кажется, поможет мне в моей преподавательской деятельности.
Следующая глава объясняет основы Numpy, затем идёт введение в библиотеку pandas. После чего идёт углубление в тему, сопровождаемое обильными примерами: очистка данных, различные важные изменения, создание графиков и визуализации, агрегация данных и группировка, временные ряды и финансовые приложения.
Последняя глава углубляет наши познания в Numpy и позволяет нам заглянуть под капот, чтобы помочь нам выжать максимум из этого пакета и понять, как лучше использовать доступные возможности. Приложение “Python Language Essentials” - хорошее введение в язык, что даст даже неопытным пользователям Python понять все приводимые примеры.
Книжка написана ясно, с большим количеством примеров и обсуждений. Для тех, кто хочет посмотреть на код - кода тут достаточно. Почти на каждой странице есть код на Python (а там, где его нет - скорее всего приводится результат выполнения кода с предыдущей страницы).
Wes McKinney принял решение сосредоточиться на Python 2.7, который используется большей частью научного и аналитического сообщества. Качественные текст и последние новости (что matplotlib** уже портирован на Python 3) облегчит переход на Python 3 в ближайшем будущем.
Если Вы хотите понять, как использовать Python в качестве аналитического инструмента - я крайне рекомендую эту книгу.

* Amazon Web Services account требуется для использования этого сервиса и он же будет использован для оплаты ваших вычислений
** То есть "Scientific tool chain" теперь доступен для Python 3

Комментариев нет:

Отправить комментарий