Xóa dữ liệu trùng lặp trên Excel là một công việc khó khăn nếu bạn đang nắm trong tay khối dữ liệu khổng lồ. Vậy làm thế nào để hoàn thành công việc này một cách nhanh chóng mà vẫn đảm bảo tính chính xác? Cùng Win Giá Rẻ tìm kiếm lời giải đáp qua 3 cách xóa dữ liệu bị trùng lặp trong Excel trong bài viết dưới đây nhé!
Các cách xóa dữ liệu bị trùng lặp trong Excel
Cách 1: Xóa dữ liệu bị trùng lặp bằng Remove Duplicates
Đây là cách xóa dữ liệu bị trùng lặp trong Excel cơ bản nhất. Nó hỗ trợ xóa dữ liệu tự động, tiết kiệm thời gian và công sức cho người xử lý số liệu.
- Sửa lỗi Alt Enter không xuống dòng được trong 1 ô Excel
- Các cách xuất file PDF từ Excel trong 1 trang giữ định dạng
Để xóa dữ liệu theo cách này, bạn thực hiện lần lượt các bước dưới đây:
Bước 1: Kéo chuột chọn toàn bộ dữ liệu bạn muốn lọc trong trang tính hiện tại. Trong trường hợp bạn muốn lọc cả trang tính, ấn tổ hợp phím Ctrl + A
Bước 2: Chọn tab Data -> trong nhóm Data Tools, chọn Remove Duplicates
Bước 3: Lúc này, hộp thoại Remove Duplicates hiển thị. Chọn cột chứa dữ liệu trùng lặp mà bạn muốn Excel giúp bạn lọc. Nếu tại bước 1, bạn chọn cả các dòng tiêu đề thì bạn cần tick thêm ô My data has headers để Excel biết và không lọc đi tiêu đề của bạn.
Bước 4: Chọn OK. Excel sẽ tiến hành lọc dữ liệu và trả về kết quả cho bạn, bao gồm số lần dữ liệu bị lặp và số dòng dữ liệu còn lại trong bảng sau khi đã xóa toàn bộ phần dữ liệu trùng.
Cách 2: Xóa dữ liệu bị trùng lặp trong Excel bằng Sort & Filter
Sort & Filter là một chức năng hữu ích trên Excel trong bộ Office bản quyền giúp người dùng lọc dữ liệu theo một hệ quy chiếu bất kỳ. Với chức năng này, bạn có thể thiết lập các điều kiện lọc, sau đó áp dụng cho toàn bộ dữ liệu trên bảng tính. Sau khi hoàn tất quá trình lọc, những dữ liệu bị trùng lặp sẽ được ẩn đi thay vì bị xóa hoàn toàn như cách 1. Bạn có thể làm việc dễ dàng với các dữ liệu sau lọc, cũng có thể phục hồi trang tính về trạng thái nguyên bản ban đầu.
Để ẩn dữ liệu bị trùng lặp bằng tính năng Sort & Filter trên Excel, bạn thực hiện lần lượt các bước:
Bước 1: Kéo chuột để chọn toàn bộ vùng dữ liệu bạn muốn lọc (trường hợp muốn chọn cả trang tính, ấn Ctrl + A)
Bước 2: Chọn tab Data -> trong nhóm công cụ Sort & Filter, chọn Advanced
Bước 3: Lúc này, hộp thoại Advanced Filter sẽ được hiển thị trên màn hình. Bạn sẽ có 2 sự lựa chọn:
- Filter the list, in-place: Lọc và giữ nguyên kết quả lọc tại vị trí này
- Copy to another location: Lọc và chuyển kết quả sau lọc sang một vị trí khác
Nếu bạn tick vào ô Copy to another location, bạn sẽ cần lựa chọn vị trí cho dữ liệu sau lọc.
Cuối cùng, bạn tick vào ô Unique records only -> chọn OK
Quá trình lọc dữ liệu trùng lặp sẽ được tiến hành ngay lập tức và trả về kết quả tại chính cột dữ liệu cũ, hoặc chuyển sang một vị trí mới (tùy theo cách bạn lựa chọn).
Cách 3: Xóa dữ liệu bị trùng lặp trong Excel bằng Power Query
Phương pháp cuối cùng được giới thiệu trong bài viết là sử dụng Power Query – một công cụ tích hợp trong Excel và Power BI, cho phép người dùng làm việc với dữ liệu nhiều nguồn một cách nhanh chóng và chính xác.
Phương pháp này tuy không đơn giản như 2 cách còn lại, tuy nhiên cũng rất đáng để sử dụng nếu bạn là người am hiểu về Excel và Power Query.
Bước 1: Chọn 1 ô trong bảng dữ liệu -> chọn tab Data -> chọn From Table Range
Bước 2: Chọn OK để xác nhận Power Query xây dựng bảng dữ liệu
Bước 3: Ấn Shift và kéo chọn dữ liệu cần lọc trong bảng -> chọn Remove Duplicates để xóa dữ liệu lặp
Bước 4: Để chuyển dữ liệu từ Power Query về dữ liệu tại băng chính, chọn Close & Load -> chọn Close & Load to…
Bước 5: Chọn Existing Worksheet -> chọn vị trí ô mà bạn muốn di chuyển dữ liệu sang đó -> chọn OK để xác nhận
Như vậy là bạn đã hoàn thành thao tác xóa dữ liệu bị trùng lặp trong Excel bằng Power Query.
Lưu ý khi xóa dữ liệu bị trùng lặp trong Excel
Khi thực hiện bất cứ một thao tác nào đối với các bảng tính chứa đựng nhiều dữ liệu quan trọng, sự cẩn thận là điều quan trọng nhất. Chắc chắn bạn sẽ không muốn chỉ vì những sai sót nhỏ của mình mà khiến dữ liệu bị “bốc hơi” khỏi trang tính, khó phục hồi lại.
Điều này là tương tự khi bạn thực hiện xóa dữ liệu trùng trong Excel. Nếu bất cẩn, hậu quả nghiêm trọng sẽ xảy ra. Vậy nên bạn cần ghi nhớ một số điều cơ bản sau khi thực hiện xóa dữ liệu trùng:
- Khi xóa dữ liệu bằng Remove Duplicates (cách 1), toàn bộ dữ liệu trùng sẽ biến mất hoàn toàn. Do đó, bạn phải cân nhắc kỹ trước khi thực hiện để tránh mất dữ liệu không mong muốn.
- Khi xóa dữ liệu bằng chức năng Sort & Filter, bạn nên chọn cách chuyển dữ liệu sau lọc sang 1 vị trí khác thay vì thay thế bảng dữ liệu cũ.
- Cách xóa dữ liệu trùng lặp bằng Power Query chỉ phù hợp với những ai có am hiểu nhất định về tính năng này hoặc từng làm việc với dữ
Tạm kết
Xóa dữ liệu bị trùng trên Excel là một thao tác quan trọng trong quá trình làm sạch dữ liệu nhằm tối ưu hiệu quả công việc. Hy vọng rằng hướng dẫn 3 cách xóa dữ liệu trùng lặp trên Excel mà Win Giá Rẻ hướng dẫn trên đây đã giúp ích cho bạn. Chúc bạn thành công!