Cách so sánh hai cột dữ liệu trong Excel để xóa, highlight, tô màu dữ liệu trùng lặp là một trong những câu hỏi đang được rất nhiều bạn quan tâm cũng như gửi câu hỏi về cho chúng tôi. Với bài viết này, Blog học excel cơ bản online sẽ hướng dẫn các bạn cách so sánh hai cột Excel trùng lặp và xóa hoặc highlight những phần trùng lặp được tìm thấy.
Giả sử bạn có 2 cột tên người – 5 tên trong cột A và 3 tên trong cột B. Bạn muốn so sánh dữ liệu giữa hai cột này để tìm các tên bị trùng lắp. Đây chỉ là ví dụ. Trong các bảng tính thực, dữ liệu để so sánh thường có hàng ngàn, hàng vạn mục.
Trường hợp A: Cả hai cột đều trong một trang tính, cùng một bảng dữ liệu: Cột A và cột B.
Trường hợp 1: cả hai cột cùng một danh sách
Trong ô trống đầu tiên, ô C1, nhập công thức: =IF(ISERROR(MATCH(A1,$B$1:$B$10000,0)),”Unique”,”Duplicate”)
Nếu bạn muốn tìm các giá trị trùng trong cột B, hoán đổi tên cột như sau: =IF(ISERROR(MATCH(B1,$A$1:$A$10000,0)),”Unique”,”Duplicate”)
Thay vì “Unique”/”Duplicate” (duy nhất/trùng lắp), bạn cũng có thể tự đặt nhãn cho mình như “Not found”/”Found” (Tìm thấy/Không tìm thấy) hoặc “Duplicate” và gõ “” thay vì “Unique”. Trong cách thứ hai, bạn sẽ có một ô trống kế bên ô mà giá trị trùng lắp không được tìm thấy.
Tất cả các ô chứa giá trị trùng đều được đánh dấu là “Duplicate”.
Trong ô đầu tiên của cột trống đầu tiên trong Sheet2 (cột B), nhập công thức: =IF(ISERROR(MATCH(A1,Sheet3!$A$1:$A$10000,0)),””,”Duplicate”)
Sheet3! là tên trang tính có chứa cột thứ 2, $A$1:$A$10000 là địa chỉ của ô tính đầu tiên và ô tính cuối cùng trong cột thứ 2.
Tương tự như bước trong trường hợp A.
Chúng ta có kết quả sau đây:
Chúng ta đã tìm thấy những giá trị trong cột thứ nhất (cột A) cũng trùng với cột thứ hai (cột B). Bây giờ chúng ta cần làm vài thứ với chúng.
Thật không hiệu quả và tốn thời gian khi tìm kiếm trên toàn bộ bảng và xem xét từng giá trị trùng lắp một cách thủ công. Có nhiều cách thực hiện ưu việt hơn.
Chỉ hiển thị hàng bị trùng trong cột A:
Ngoài gắn nhãn “Duplicate”, bạn cũng có thể đánh dấu các giá trị trùng bằng một cách khác như định dạng màu chữ hoặc bôi màu nó.
Lọc các giá trị trùng lặp như giải thích ở trên, chọn các ô tính đã lọc và nhấn để mở hộp thoại Format Cells. Ví dụ: hãy thay đổi màu nền của các hàng bị trùng sang màu vàng tươi. Tất nhiên, bạn có thể thay đổi màu nền của các ô này bằng cách sử dụng tùy chọn trên thẻ , nhưng ưu thế của hộp thoại Format Cells là nó cho phép bạn thực hiện tất cả các thay đổi định dạng cùng lúc.
Lọc bảng dữ liệu để hiển thị các giá trị trùng lặp, chọn tất cả những ô đó.
Nếu hai cột được so sánh nằm trên hai trang tính khác nhau, cụ thể là trong hai bảng dữ liệu riêng biệt, nhấp phải vào vùng dữ liệu được chọn và chọn Delete Row từ danh sách tùy chọn.
Nếu hai cột nằm trên cùng một trang tính, hai cột liền kề hoặc không liền kề, việc xóa những giá trị trùng lắp sẽ phức tạp hơn. Chúng ta không thể xóa toàn bộ hàng chứa chúng bởi vì như vậy sẽ xóa những ô tương ứng trong cột 2. Vì vậy, để hiển thị những giá trị duy nhất trong cột A, thực hiện theo các bước sau:
Lọc bảng để các giá trị trùng lặp được hiển thị và chọn tất cả những ô đó. Nhấp phải vào vùng được chọn và chọn Clear Contents.
Bỏ bộ lọc.
Chọn tất cả ô tính trong cột A bắt đầu từ ô A1 đến ô cuối cùng có chứa dữ liệu.
Di chuyển đến thẻ , nhấp chọn . Trong hộp thoại mở ra, chọn Continue with the current selection và nhấn .
Xóa cột chứa công thức, chỉ để lại “Uniques”
Như vậy, cột A chỉ còn những dữ liệu không bị trùng lặp trong cột B.