Percentile là gì? Percentile được ứng dụng và được tính toán như nào?

Chúng tôi rất vui mừng chia sẻ kiến thức sâu sắc về từ khóa Percentile la gi và hy vọng rằng nó sẽ hữu ích cho bạn đọc. Bài viết tập trung trình bày ý nghĩa, vai trò và ứng dụng của từ khóa này trong việc tối ưu hóa nội dung trang web và chiến dịch tiếp thị trực tuyến. Chúng tôi cung cấp các phương pháp tìm kiếm, phân tích và lựa chọn từ khóa phù hợp, cùng với các chiến lược và công cụ hữu ích. Hy vọng rằng thông tin mà chúng tôi chia sẻ sẽ giúp bạn xây dựng chiến lược thành công và thu hút lưu lượng người dùng. Xin chân thành cảm ơn sự quan tâm và hãy tiếp tục theo dõi blog của chúng tôi để cập nhật những kiến thức mới nhất.

Tomorrow Marketers – Percentiles là phương pháp đã cho chúng ta biết có bao nhiêu phần trăm điểm tài liệu nhỏ hơn một mốc giá trị cụ thể. Ví dụ: một người dân có chỉ số IQ 120 ở 91% Percentile (P91), có tức thị chỉ số IQ của người này mạnh hơn 91% những người dân khác.

Bạn Đang Xem: Percentile là gì? Percentile được ứng dụng và được tính toán như nào?

Percentile là một dụng cụ rất tốt để bạn biết được vị trí tương đối của một giá trị, xem chúng đứng ở đâu trong biểu đồ phân phối tần suất của tệp tài liệu. Trong nội dung bài viết sau, cùng Tomorrow Marketers tìm hiểu về percentile, các trường hợp đặc biệt quan trọng của percentile và cách vận dụng chỉ số này trong thống kê mô tả nhé!

Đọc thêm: 04 thời đoạn phân tích tài liệu – Descriptive, Diagnostic, Predictive & Prescriptive Analytics

1. Percentile có ý nghĩa gì?

Percentile có thể đã cho chúng ta biết vị trí của một giá trị so với những giá trị khác ví như thế nào. Dễ hiểu hơn, nếu giá trị X ở percentile thứ K, thì X to ra thêm K% giá trị.

Ví dụ, nếu điểm kiểm tra đứng riêng lẻ mà không có sự so sánh với điểm số của những người dân sót lại trong cuộc thi, thì điểm đó không cho thấy thứ bậc (ranking) ở đâu so với những người dân sót lại. Khi chúng ta đạt 500 điểm TOEIC, số lượng 500 này sẽ không chỉ ra đây là số lượng cao hay thấp, không đã cho chúng ta biết có bao nhiêu phần trăm người trên 500 điểm và bao nhiêu phần trăm người dưới 500 điểm. Khi đối chiếu với kỳ thi SAT, nếu tổng điểm của bạn là 1340, số lượng này nằm ở khoảng chừng 90% Percentile (P90), đồng nghĩa điểm số của bạn mạnh hơn 90% thí sinh khác.

2. Các trường hợp đặc biệt quan trọng của Percentile

Một số trường hợp đặc biệt quan trọng của Percentile có những cái tên riêng:

Quartile là giá trị chia tập tài liệu thành bốn phần bằng nhau:

  • Quartile thứ nhất (Q1 hay còn được gọi là quartile dưới), là giá trị của 25th percentile. Một phần tư tài liệu nhỏ hơn giá trị này, trong lúc ba phần tư tài liệu sót lại to ra thêm giá trị này.
  • Quartile thứ hai (Q2 hay đó chính là median – giá trị trung vị). Giá trị này chia tập tài liệu thành hai nửa. Một nửa có mức giá trị thấp hơn giá trị tại P50, một nửa sót lại có mức giá trị mạnh hơn giá trị tại P50. Quartile thứ hai đó chính là median – đây là giá trị nằm ở ở vị trí chính giữa của tập tài liệu sau khoản thời gian được sắp xếp theo trật tự.
  • Quartile thứ ba (Q3 hay còn được gọi là quartile trên), là giá trị của 75% percentile. Một phần tư tài liệu to ra thêm giá trị này, trong lúc ba phần tư tài liệu sót lại nhỏ hơn giá trị này.

The interquartile range (IQR) là thước đo mức độ phân tán trong thống kê. Khoảng tầm giá trị này tương ứng với khoảng chừng cách giữa quartile thứ nhất và quartile thứ ba (IQR = Q3 – Q1), tương đương với một nửa giá trị của tập tài liệu. Một phần tư giá trị nhỏ hơn IQR và một phần tư giá trị khác to ra thêm IQR. Khi so sánh 2 dataset thuộc cùng một biến, tệp nào có IQR to ra thêm cho thấy tài liệu phân tán rộng hơn.

Percentile có thể được ứng dụng linh hoạt. Không chỉ giúp đỡ bạn xác định vị trí tương đối của một giá trị, Percentile còn làm chia tập tài liệu thành các phần, xác định xu hướng trung tâm, phát hiện giá trị ngoại lai (outlier) và đo lường và thống kê sự phân tán của phân phối. Nói tóm lại, Percentile là một dụng cụ phân tích tài liệu hữu ích trong thống kê mô tả.

3. Percentile được tính như nào?

Xem Thêm : Âm thanh là gì? những kiến thức cơ bản về hệ thống âm thanh

Ở chỗ này là ba hướng tiếp cận mà các nhà phân tích sử dụng để tính Percentile khi xem xét bộ tài liệu tương đối nhỏ. Ba hướng tiếp cận này xác định phân vị thứ k theo các phương pháp khác nhau sau:

  • Tìm giá trị nhỏ nhất to ra thêm k phần trăm của rất nhiều giá trị.
  • Tìm giá trị nhỏ nhất to ra thêm hoặc bằng k phần trăm giá trị.
  • Tìm một giá trị nội suy giữa hai trật tự nhanh nhất (Nội suy là phương pháp ước tính giá trị của những điểm tài liệu không biết trong phạm vi của một tập hợp rời rạc chứa một số điểm tài liệu đã biết).

Trước lúc tính Percentile bằng phương pháp sử dụng ba hướng tiếp cận này, bạn phải mở màn bằng phương pháp sắp xếp tập tài liệu từ giá trị thấp nhất đến giá trị tốt nhất có thể.

Hãy sử dụng ba hướng tiếp cận này với tập tài liệu sau (n=11) để tìm P70 (70% Percentile):

Hướng tiếp cận 1: To thêm

Với hướng tiếp cận này, tất cả chúng ta cần tìm giá trị to ra thêm 70% giá trị của 11 điểm tài liệu. Lấy 70% của 11, ta được thứ hạng 7,7. Sau đó, làm tròn 7,7 lên mức 8. Giá trị của P70 phải to ra thêm giá trị của 8 điểm tài liệu. Như vậy, giá trị của P70 bằng giá trị của điểm tài liệu thứ 9 theo trật tự của tập tài liệu, tương đương 40.

Hướng tiếp cận 2: To thêm hoặc bằng

Với hướng tiếp cận này, tất cả chúng ta cần tìm giá trị to ra thêm hoặc bằng 70% giá trị của 11 điểm tài liệu. Tương tự, lấy 70% của 11, là 7,7. Sau đó, làm tròn 7,7 lên mức 8. Giá trị của P70 phải to ra thêm hoặc bằng giá trị của 8 điểm tài liệu. Như vậy, giá trị của P70 có thể bằng giá trị của điểm tài liệu thứ 8 theo trật tự của tập tài liệu, tương đương 35. Có thể thấy hai hướng tiếp cận với hai hướng tiếp cận khác nhau đã cho ra hai kết quả khác nhau.

Hướng tiếp cận 3: Giá trị nội suy giữa hai trật tự nhanh nhất

Như bạn đã thấy từ ví dụ trên, việc sử dụng “to ra thêm” hoặc “to ra thêm hoặc bằng” sẽ cho ra những kết quả khác nhau đáng kể, đặc biệt quan trọng khi chúng ta đang thao tác với một tập tài liệu nhỏ. Tùy thuộc vào thực chất và kích thước của tập tài liệu, sự khác biệt này sẽ thay đổi đáng kể ý nghĩa của tài liệu. Hướng tiếp cận thứ ba – giá trị nội suy giữa hai giá trị tài liệu nhanh nhất – sẽ khắc phục vấn đề này.

Bạn cần phải tuân theo các bước sau:

  1. Tính thứ hạng để sử dụng cho percentile. Sử dụng: xếp hạng = p(n+1), trong đó p = phần trăm và n = cỡ mẫu. Với ví dụ trên, để tìm thứ hạng cho P70, lấy 0,7*(11 + 1) = 8,4.
  2. Nếu thứ hạng tính được trong bước một là một số nguyên, hãy tìm giá trị tài liệu tương ứng với thứ hạng đó và coi đây là giá trị của percentile.
  3. Nếu thứ hạng tính được trong bước 1 không phải là số nguyên, bạn phải nội suy giữa hai quan sát nhanh nhất. Với ví dụ trên, 8,4 nằm trong khoảng chừng từ 8 đến 9, tương ứng với những giá trị tài liệu là 35 và 40.
  4. Lấy sự khác biệt giữa hai giá trị tài liệu này và nhân nó với phần thập phân của thứ hạng đã tính trong bước phía trên. Với ví dụ trên, (40 – 35)*0,4 = 2 (0,4 là phần thập phân của 8,4).
  5. Lấy giá trị được xếp hạng thấp hơn trong bước 3 và thêm giá trị từ bước 4 để thu giá thành rẻ trị nội suy cho percentile. Với ví dụ trên, giá trị đó là 35 + 2 = 37.

Kết quả, có ba giá trị khác nhau cho P70: 35, 37 và 40.

Hướng tiếp cận 4: Percentile Rank

Có cách khác để tính toán percentile – đó là percentile rank.

“In statistics, the percentile rank (PR) of a given score is the percentage of scores in its frequency distribution that are less than that score” – Trong thống kê, thứ hạng phần trăm (PR) của một điểm nhất định là tỷ lệ phần trăm của những điểm trong phân chia tần suất nhỏ hơn điểm đó.

Các nhà phân tích thường sử dụng cách này để phân loại điểm số của rất nhiều cuộc thi đã được tiêu chuẩn hóa, vì đặc thù của tệp tài liệu này là chúng có rất nhiều data point tái diễn. Ví dụ, có hàng triệu người tham gia kỳ thi SAT và có rất nhiều người cùng đạt điểm số giống nhau trong khoảng chừng từ 200 đến 800.

Xem Thêm : Điểm phúc khảo là gì?

Công thức tính Percentile rank:

Trong số đó PR: Percentile Rank, CF: Cumulative Frequency, F: Frequency.

Ví dụ, xem xét tệp tài liệu sau có những điểm tài liệu ở cột Score và tần suất xuất hiện của chúng ở cột Frequency:

Hình này minh họa phương pháp tính Percentile Rank và cho biết phương pháp thức chỉ số 0,5 × F trong công thức đảm nói rằng Percentile Rank phản ánh Percentage of Score thấp hơn một điểm đã chỉ định.

Ví dụ: khi đối chiếu với 10 điểm được hiển thị trong hình, 60% trong số đó dưới điểm 4 (năm điểm nhỏ hơn 4 và một nửa của hai điểm bằng 4) và 95% dưới 7 (chín điểm dưới 7 và một nửa của một bằng 7). Thông thường, Percentile Rank chỉ được tính cho những data point có trong phân phối nhưng, như hình minh họa, xếp hạng phần trăm cũng luôn có thể được tính cho điểm có tần suất bằng không. Ví dụ, 90% số điểm nhỏ hơn 6 (chín điểm nhỏ hơn 6, không điểm nào bằng 6).

Hướng tiếp cận 6: Sử dụng phân phối chuẩn (Normal Distribution) để ước tính Percentile

Độ cao có xu hướng tuân theo phân phối chuẩn (normal distribution), vì vậy hãy lấy độ cao làm case study của hướng tiếp cận này. Giả sử, độ cao của population tuân theo phân phối chuẩn với giá trị trung bình (mean) là một trong những,512 mét và độ lệch chuẩn (standard deviation) là 0,0741 mét.

Khi đối chiếu với các population có phân phối chuẩn, chúng ta cũng có thể sử dụng Z-scores để tính percentile. Z-score của một quan sát là số độ lệch chuẩn mà nó nằm trên hoặc dưới mức trung bình của tổng thể. Hướng tiếp cận này tương đối thuận tiện nếu khách hàng chỉ có thông tin tóm tắt về sample và có mức giá trị Z-scores.

Chúng ta cũng có thể sử dụng hàm tỷ trọng xác suất (PDF) để tính toán và vẽ biểu đồ của percentile. Trong loại biểu đồ tỷ trọng xác suất này (probability density plot), tỷ lệ của diện tích quy hoạnh được tô đậm dưới đường cong biểu thị tỷ lệ phần trăm phân phối nằm trong phạm vi giá trị đó. Biểu đồ này được tô đậm 70% giá trị thấp hơn giá trị 1.551m, tức thị giá trị độ cao tương ứng của P70 là một trong những.551m.

Biểu đồ này cho thấy độ cao 1,551 mét nằm ở P70 khi đối chiếu với population nữ sinh trung học này.

Tạm kết

Percentile là một giá trị hữu ích để hiểu vị trí của một giá trị trong phân phối của tài liệu, song song có thể tương trợ trong việc phát hiện các tài liệu ngoại lai (outlier). Hy vọng thông qua nội dung bài viết này, bạn đã hiểu Percentile là gì, ứng dụng trong thống kê mô tả như nào và biết được những phương pháp tính Percentile khác nhau. Nếu như khách hàng quan tâm hơn về các tri thức thống kê mô tả trong phân tích tài liệu, hãy tham khảo khóa học Data Analysis của Tomorrow Marketers nhé!

Nội dung bài viết được biên dịch bởi Tomorrow Marketers, xin vui lòng không sao chép dưới mọi hình thức!

You May Also Like

About the Author: v1000

tỷ lệ kèo trực tuyến manclub 789club