Cleaning Data for Effective Data Science: Doing the other 80% of the work with Python, R, and command-line tools
Format:
Paperback
Kindle
Paperback
En stock
0.92 kg
Sí
Nuevo
Amazon
USA
- A comprehensive guide for data scientists to master effective data cleaning tools and techniquesKey FeaturesThink about your data intelligently and ask the right questionsMaster data cleaning techniques using hands-on examples belonging to diverse domainsWork with detailed, commented, well-tested code samples in Python and RBook DescriptionIn data science, data analysis, or machine learning, most of the effort needed to achieve your actual purpose lies in cleaning your data. Using Python, R, and command-line tools, you will learn the essential cleaning steps performed in every production data science or data analysis pipeline. This book not only teaches you data preparation but also what questions you should ask of your data.The book dives into the practical application of tools and techniques needed for data ingestion, anomaly detection, value imputation, and feature engineering. It also offers long-form exercises at the end of each chapter to practice the skills acquired.You will begin by looking at data ingestion of a range of data formats. Moving on, you will impute missing values, detect unreliable data and statistical anomalies, and generate synthetic features that are necessary for successful data analysis and visualization goals.By the end of this book, you will have acquired a firm understanding of the data cleaning process necessary to perform real-world data science and machine learning tasks.What you will learnIngest and work with common tabular, hierarchical, and other data formatsApply useful rules and heuristics for assessing data quality and detecting biasIdentify and handle unreliable data and outliers in their many formsImpute sensible values into missing data and use sampling to fix imbalancesGenerate synthetic features that help to draw out patterns in your dataPrepare data competently and correctly for analytic and machine learning tasksWho this book is forThis book is designed to benefit software developers, data scientists, aspiring data scientists, and students who are interested in data analysis or scientific computing.Basic familiarity with statistics, general concepts in machine learning, knowledge of a programming language (Python or R), and some exposure to data science are helpful.The text will also be helpful to intermediate and advanced data scientists who want to improve their rigor in data hygiene and wish for a refresher on data preparation issues.Table of ContentsData Ingestion – Tabular FormatsData Ingestion - Hierarchical FormatsData Ingestion - Repurposing Data SourcesThe Vicissitudes of Error - Anomaly DetectionThe Vicissitudes of Error - Data QualityRectification and Creation - Value ImputationRectification and Creation - Feature EngineeringAncillary Matters - Closure/Glossary
IMPORT EASILY
By purchasing this product you can deduct VAT with your RUT number
20% OFF adicional al pagar con Deuna
Productos Relacionados
Ver másOtros Productos
Ver másCompra protegida
Disfruta de una experiencia de compra segura y confiable
¿Cómo comprar?
Información de Aduanas Ecuador
En Tiendamia puedes hacer tus compras a través de la categoría B (4x4) y la categoría C. No tendrás que hacer trámites de aduana. Hacemos todo por ti.
- El 4x4 (o categoría B)
- a. No paga impuestos ecuatorianos.
- b. Tienes una cantidad ilimitada de órdenes en el régimen 4x4 siempre que cada una de estas esté dentro del peso máximo permitido (hasta 4 kg) y no superen los $400, además de cumplir con el cupo anual por persona.
- c. El cupo anual máximo es de $1.600 al año para compras en el exterior a través del régimen 4x4. El cupo anual se limitan a una cédula pero no a tu usuario de Tiendamia.
- d. Se puede comprar una gran variedad de productos dentro de esta categoría siempre y cuando cumplan con el 4x4 y no sean para fines comerciales, por esa razón, se puede comprar máximo 3 productos iguales o similares de la misma categoría. Por ejemplo, puedes comprar hasta 3 perfumes, hasta 3 relojes y hasta 3 pares de zapatos, si te excedes de esta cantidad tu orden puede tener cargos extra por parte de la aduana.
- Las tablets, laptops y celulares se pueden comprar a través de la Categoría C.
- a. Esta categoría sí paga impuestos (IVA + Fodinfa)
- b. Solo se puede comprar un celular nuevo al año, no se admiten refabricados, usados u “open box.”
Garantía de entrega
Con Tiendamia todas tus compras cuentan con Garantía de Entrega o devolución total de tu dinero.
Compras 100% seguras y garantizadas, para que pidas lo que sueñas y lo recibas del mundo a tu puerta.
¿Cómo solicitar una devolución?
Para solicitar una devolución, el cliente debe realizarlo a través de su cuenta de Tiendamia. Este proceso está sujeto a la aprobación del departamento de Devoluciones (lo cual puede demorar de 48hs a 72hs hábiles). En caso de no tener la opción en la web, el cliente debe contactarse con Atención al Cliente para iniciar la solicitud.
Los productos sin devolución son:
- Los productos que tienen un tiempo de entrega mayor a 20 días hábiles.
- Productos que por su naturaleza no admiten devolución en EE.UU. o China y, por lo tanto, Tiendamia no puede ofrecer la devolución al cliente. Ejemplos: perfumes, cremas y medicamentos.
Tarjetas de Débito y Crédito
Visa
Mastercard
American Express
Dinners
Discover
Alias
Pagos a través de PayPal
Compra procesada en dólares con dinero en cuenta o tarjetas internacionales.
PayPal