Distribution and statistics

1.3. Distribution and statistics#

EDA là quá trình phân tích dữ liệu để hình dung được dữ liệu, hiểu được các khía cạnh khác nhau của dữ liệu, từ đó đưa ra được các giải pháp và hướng triển khai phù hợp

1. Thống kê mô tả

  • Tính toán các estimator của sample: mean, median, mode, variance, std, range, min, max, missing ratiom, unique ratio, skewness, kurtois, distribution, correlation,…

2. Thống kê suy luận

  • Sử dụng các kiểm định giả thuyết để kiểm tra tính đại diện của sample, hoặc so sánh giữa các sample

1.3.1. Description statistics#