Blogs

Outlier Là Gì – Nghĩa Của Từ Outlier

Bạn đang quan tâm đến Outlier Là Gì – Nghĩa Của Từ Outlier phải không? Nào hãy cùng VCCIDATA đón xem bài viết này ngay sau đây nhé, vì nó vô cùng thú vị và hay đấy!

XEM VIDEO Outlier Là Gì – Nghĩa Của Từ Outlier tại đây.

trong Data Mining and Business Intelligence…Data Mining and Business Intelligence…(Entire Site)

Tìm kiếm

BIS » Data Mining and Business Intelligence » Data Mining and Business Intelligence » Vấn đề xử lý bất thường (outlier) trong dữ liệu

Đang xem: Outlier là gì

*

*

Xem thêm: Cách Thanh Toán Thẻ Tín Dụng Citibank Ở Đâu, Rút Tiền Từ Thẻ Tín Dụng Ngân Hàng Citibank

*

gmail.com

Trong quá trình thu thập,phân tí;ch dữ liệu, ta thường gặp các quan sát mà giá trị của nó rất khác biệtso với giá trị của các quan sát khác, đây gọi là các bất thường (hay ngoại lai– Outlier).

Outlierlà gì?

Outlier là các giá trị cực(extreme values) so với các giá trị khác được quan sát trong cùng một điều kiện.Outlier có thể là một giá trị đơn lẻ, nhưng cũng có thể là giá trị từ hai haynhiều biến số. (Outliers are observations that have extreme values relative toother observations observed under the same conditions. Observations may beoutliers because of a single large or small value of one variable or because ofan unusual combination of values of two or more variables)

Vấn đề ở đây là thế nàolà “giá trị cực” hay outlier? Đây là câu hỏi khó trả lời và thường phụ thuộcvào yêu cầu phân tí;ch của bài toán đặt ra.Bạn đang xem: Outlier là gì

Xem thêm: Vã Là Gì – Nghĩa Của Từ Vã

*

Phát hiện outlier có rất nhiều ýnghĩa và ứng dụng trong rất nhiều lĩnh vực như phát hiện gian lận trong giao dịchtài chí;nh, viễn thông…; phân tí;ch hành vi khách hàng, người tiêu dùng; phát hiệnbệnh tật (các bất thường thường được quan tâm trong y học vì có khả năng bị bệnhcao);…

Mộtsố cách phát hiện bất thường

Có rất nhiều cách để pháthiện bất thường trong dữ liệu tùy thuộc vào dữ liệu nguồn, yêu cầu phân tí;ch củabài toán đặt ra hay kinh nghiệm của người phân tí;ch.

Dựavào phân phối chuẩn (nếu dữ liệu tuân theo luật phân phối chuẩn):

Ta biết rằng nếu biến sốX tuân theo luật phân phối chuẩn với trung bình m và độ lệch chuẩn s thì 99%các giá trị của X phải nằm trong khoảng m – 3*s đến m + 3*s. Do đó, nếu có xinào có giá trị nằm ngoài khoảng này thì có thể nghi ngờ là outlier

Dựavào đồ thị (histogram, scatter, Plot box…)

Dựavào các kỹ thuật phân cụm (clustering technique)

Dựavào phương pháp mật độ (Density-based Approaches)

Khiphát hiện các outlier trong dữ liệu thìxử lý như thế nào?

Có rất nhiều cách để xửlý outlier khi phát hiện, mỗi cách có ưu và nhược điểm riêng. Việc chọn cáchnào tùy thuộc vào yêu cầu phân tí;ch dữ liệu của bài toán đặt ra.

Sau đây là một số cách xửlý outliers:

·Changevalue to mean: Các giá trị outlier sẽ được thay bằng giátrị trung bình

·Changevalue to null: Xóa giá trị oulier đặt lại là null(empty)

·Change value to specific value: Đổioutlier thành một giá trị cụ thể (do người phân tí;ch, chuyên gia đề xuất)

Giớithiệu công cụ xử lý outlier

XEM THÊM:  Tác Dụng Của Việc Đeo Tạ Chân Có Tốt Không, Đeo Tạ Chân Để Chạy Bộ Có Tốt Không

Vậy là đến đây bài viết về Outlier Là Gì – Nghĩa Của Từ Outlier đã dừng lại rồi. Hy vọng bạn luôn theo dõi và đọc những bài viết hay của chúng tôi trên website VCCIDATA.COM.VN

Chúc các bạn luôn gặt hái nhiều thành công trong cuộc sống!

Related Articles

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Back to top button