Đề Xuất 4/2023 # Cách Lọc, Xoá Data Trùng Lặp Trong File Excel # Top 9 Like | Beiqthatgioi.com

Đề Xuất 4/2023 # Cách Lọc, Xoá Data Trùng Lặp Trong File Excel # Top 9 Like

Cập nhật nội dung chi tiết về Cách Lọc, Xoá Data Trùng Lặp Trong File Excel mới nhất trên website Beiqthatgioi.com. Hy vọng thông tin trong bài viết sẽ đáp ứng được nhu cầu ngoài mong đợi của bạn, chúng tôi sẽ làm việc thường xuyên để cập nhật nội dung mới nhằm giúp bạn nhận được thông tin nhanh chóng và chính xác nhất.

Cách lọc, xoá dữ liệu trùng lặp trong file Excel sẽ hướng dẫn cho bạn sử dụng một trong những tính năng tuyệt vời của phần mềm bảng tính Excel, giúp cho bạn dễ dàng phần loại, lọc những dữ liệu trùng lặp trong hàng trăm, hàng ngàn dữ liệu một cách nhanh chóng

Cách lọc, xoá dữ liệu trùng lặp trong file Excel

1. Lọc dữ liệu trùng lặp trong file Excel

Tiến hành lọc dữ liệu trùng lặp sẽ giúp bạn dễ dàng phân loại những dữ liệu khác nhau. Ví dụ như bạn có thể phân loại những học sinh có cùng số điểm toán, hoặc phân loại những người có cùng năm sinh,….

Bước 1: Chọn vùng dữ liệu cần lọc, bạn có thể chọn nhiều ô, hàng, cột dữ liệu cần lọc.

Bước 2: Ngay trên tab Home bạn sẽ thấy lựa chọn Sort amp; Filter. Sau đó, bạn tiếp tục lựa chọn Filter để phân loại dữ liệu trong Excel

Bước 3: Tiếp theo, bạn sẽ thấy hàng đầu tiên của mỗi cột chứa những ô dữ liệu mà bạn đã chọn xuất hiện những biểu tượng hình tam giác. Đây chính là những giá trị giúp bạn lọc dữ liệu trùng lặp trong file Excel

Bước 4: Ví dụ như bạn muốn lọc những người có điểm Toán là 7, bạn nhấn vào biểu tượng tam giác cạnh giá trị Toán sau đó bỏ tích ở tất cả các ô giá trị khác, chỉ đặt dấu tích ở số 7 và nhấn OK.

Kết quả là bảng tính Excel sẽ chỉ hiển thị hiển thị những người có điểm toán là 7. Nếu bạn muốn hiển thị đầy đủ danh sách như cũ, bạn có thể thực hiện lại thao tác tương tự và tích vào đầy đủ các ô trong phần Filter.

2. Xoá dữ liệu trùng lặp trong file Excel

Nếu trong file Excel có quá nhiều dữ liệu, trong đó có vài dữ liệu trùng lặp mà bạn không thể kiểm soát được thì Excel cũng đã có một tính năng giúp bạn xử lý vấn đề này nhanh chóng mà không cần phải dò tìm từng hàng giá trị trùng mất thời gian.

Bước 1: Đầu tiên, bạn bôi đen toàn bộ vùng dữ liệu muốn thực hiện tiến trình tự động xoá dữ liệu trùng lặp trong file Excel

Bước 2: Tiếp theo, bạn nhấn vào lựa chọn Remove Duplicates trong tab Data

Bước 3: Trên cửa sổ Remove Duplicates, bạn tích vào những cột mà muốn lọc chứa những ô có giá trị trùng lặp. Ví dụ như bạn muốn lọc dữ liệu của những hàng có cùng giá trị Họ và tên, điểm Toán, Văn, Anh bạn sẽ tích như trong hình.

Bước 4: Ngay lập tức, bạn đã thấy một trong hai giá trị trùng lặp đã biến mất. Excel sẽ xoá dữ liệu trùng lặp thứ hai và giữ lại giá trị đầu tiên.

Lọc Dữ Liệu Trùng Lặp Trong Google Sheets 2022

Đối với Tuyển dụng cũng như các lĩnh vực khác, chúng ta thường dùng Google Biểu mẫu để lấy data ứng viên hay khách hàng. Kết quả sẽ lưu vào Google Sheets giống như Excel chắc chắn việc trùng lặp dữ liệu là không thể nào tránh khỏi. Vậy làm sao để lọc dữ liệu trùng lặp trong Google Sheets (Trang tính)? Excel thì bạn dễ tìm trên mạng nhưng Google Sheets thì cách lọc có khác. Hiếu sẽ chia sẻ đến các bạn trong bài viết đầu tiên của trang Minh Hiếu HR và của chuyên mục Chia sẻ trong ngành.

Cập nhật 28/02/2018: Lọc bỏ dữ liệu xuất hiện lần 2 trở đi thay đổi cách làm nhanh gọn, chính xác, dễ hiểu.

Cập nhật 23/04/2021: Cách lọc dữ liệu trùng lặp Google Sheet bằng công cụ tiện ích.

Trong danh sách trên có nhiều tên bị trùng nhau. Chúng ta có thể tìm giữ liệu trùng nhau và lọc chúng theo nhiều cách, tùy nhu cầu của bạn.

Để tìm dữ liệu trùng nhau trong Google Sheets, chúng ta chọn cột chứa dãy dữ liệu. Nhấp vào Định dạng chọn Định dạng theo điều kiện.

Trong bảng Quy tắc định dạng có điều kiện, chúng ta điền công thức như hình bên dưới.

Như vậy bạn đã thấy dễ dàng thấy được các dữ liệu trùng nhau, tiếp theo chúng ta sẽ lọc chúng. Có 2 cách lọc dữ liệu trùng nhau trong Google trang tính.

Lọc ra dữ liệu trùng hoặc không trùng

=countif(A:A;A2)=1

Lúc này TRUE là các dữ liệu không bị trùng, còn FALSE là các dữ liệu bị trùng nhau. Chúng ta nhấp vào dãy số 1 để chọn dãy tên, nhấp Dữ liệu và chọn Bộ lọc.

Tiếp theo nhấp vào nút lọc. Bây giờ chúng ta muốn xem dữ liệu không trùng nhau thì giữ lại TRUE, còn muốn xem dữ liệu bị trùng nhau thì giữ lại FALSE.

Và kết quả thu được khi chúng ta giữ lại TRUE – dữ liệu không trùng.

Nhưng cách này chưa phải là tối ưu. Chúng ta chỉ xem được trùng hoặc không trùng. Điều mà chúng ta mơ ước chính là một danh sách đầy đủ dữ liệu, chỉ lọc bỏ đi những dữ liệu bị lặp 2 lần trở lên. Hiếu cam đoan đây là bài viết đầu tiên xuất hiện trên Google giúp bạn làm điều này. haha

Lọc bỏ dữ liệu xuất hiện lần 2 trở đi

Chọn ô đầu tiên kế bên cột chứa dữ liệu, Hiếu chọn cột B thì tương ứng với A2 sẽ là B2. Ở ô này bạn điền công thức như ảnh dưới.

Như vậy là những ô lặp lại lần thứ 2 trở đi sẽ đổi thành Tranngocminhhieu.com

=if(countif($A$2:A2;A2)=1;A2;”Tranngocminhhieu.com”)

Giải thích:

$A$2: là để cố định không thay đổi

A2: sẽ thay đổi khi kéo xuống

“Tranngocminhhieu.com”: Tùy bạn muốn ghi gì cũng được

Tuyệt vời chưa, hehe

Kết quả bạn đã có môt danh sách đầy đủ dữ liệu, không bị mất bất dữ liệu nào mà cũng không trùng dữ liệu nào. Bạn cũng có thể thấy được dữ liều nào có trùng ở ô có highlight.

Lọc dữ liệu trùng lặp bằng công cụ tiện ích

Mình thấy có khá nhiều bạn không rành về dùng công thức lắm nên mình đã cập nhật thêm một cách mới tự động hóa hơn để lọc dữ liệu trùng lặp trong Google Sheet.

Bước 2: Bạn tìm từ khóa “remove duplicates” và chọn tiện ích của tác giả EXPAND9. Đừng chọn mấy cái khác, mình thử rồi và thấy của EXPAND9 là ngon và dễ dùng nhất.

remove duplicates

Bước 3: Bạn nhấp vào nút Cài đặt

Kết

Cách Xóa Dữ Liệu, Nội Dung Trùng Lặp Trong Excel

Trong khi làm việc với bảng Excel, sẽ có không ít lần bạn gặp phải các trường hợp trùng lặp dữ liệu trong một danh sách, hoặc một bảng dữ liệu. Nếu bảng số liệu với ít dữ liệu sẽ dễ dàng trong việc phát hiện những nội dung bị trùng lặp, như các dòng trùng lặp dữ liệu không đồng bộ.

Tuy nhiên khi xử lý với 1 tài liệu Excel lớn, nhiều số liệu, nội dung thì việc tìm kiếm từng dòng và xóa theo cách thủ công là không khả thi. Vậy tại sao chúng ta không sử dụng ngay tính năng có sẵn của Excel?

Cách 1: Remove Duplicate xóa dữ liệu trùng lặp Excel

Tính năng Remove Duplicate có sẵn trên Excel có khả năng giúp bạn phát hiện những dòng trùng lặp trong bảng dữ liệu và tiến hành xóa nhanh chóng.

Bước 1:

Trước hết, chúng ta cần bôi đen vùng nội dung cần xóa trùng lặp, sau đó vào tab Data rồi chọn Remove Duplicates.

Bước 2:

Xuất hiện giao diện một hộp thoại mới. Tại đây bạn sẽ lựa chọn các trường có trong bảng để tính năng có thể tiến hành lọc và phát hiện những nội dung trùng nhau. Ở đây, tôi sẽ bỏ tích cột STT vì các dòng đều có số khác nhau. Chỉ tích chọn vào Họ và tên và cột Địa chỉ mà thôi.

Sau đó nhấn OK để tiến hành.

Bước 3:

Ngay sau đó bạn sẽ nhận được thông báo tìm được bao nhiêu giá trị nội dung trùng lặp. Chẳng hạn với bảng thống kê trên sẽ có 2 dòng trùng lặp và sẽ tự động được xóa khỏi bảng Excel.

Cách 2: Đánh dấu dữ liệu trùng lặp Excel để xóa thủ công

Nếu bạn muốn kiểm tra lại nội dung trùng lặp trong bảng kỹ hơn có thể sử dụng cách đánh dấu dòng Hightlight. Những dòng hay nội dung trong bảng giống nhau sẽ có cùng 1 màu khác biệt. Như vậy người dùng sẽ dễ dàng kiểm tra lại hơn rồi quyết định xóa hay chỉ chỉnh sửa lại.

Bước 1:

Bước 2:

Xuất hiện hộp thoại nhỏ. Tại đây, phần nội dung trùng lặp sẽ được đánh dấu bằng 1 loại màu khác để người dùng dễ nhận biết. Bạn có thể lựa chọn các màu Hightlight khác nhau có trong bảng, sau đó nhấn OK.

Bước 3:

Như vậy với 2 cách vô cùng đơn giản và sử dụng tính năng có sẵn trên Excel, mà chúng ta có thể dễ dàng phát hiện dòng có nội dung trùng lặp. Trong trường hợp bạn không cần phải xem xét lại các dòng, muốn xóa luôn những giá trị bị trùng thì sử dụng tính năng Remove Duplicate. Nếu muốn kiểm tra lại thì sử dụng cách Hightlight đánh dấu dữ liệu giống nhau sau đó mới xóa.

Video hướng dẫn xóa nội dung trùng lặp trên Excel

Cách Tạo Dãy Số Ngẫu Nhiên Không Trùng Lặp Trong Excel

Như bạn đã biết, Microsoft Excel có một số hàm để tạo chuỗi số ngẫu nhiên như RAND, RANDBETWEEN và RANDARRAY. Tuy nhiên, không có gì đảm bảo rằng kết quả của các hàm trên sẽ không bị trùng lặp.

Trong bài viết này sẽ hướng dẫn bạn xây dựng các công thức để tạo ra danh sách các số ngẫu nhiên là duy nhất. Tuy nhiên bạn cần chú ý là có một số hàm chỉ khả dụng tại phiên bản Excel 365 nên nếu bạn sử dụng phiên bản thấp hơn thì sẽ không tìm thấy hàm được áp dụng trong bài viết. Tuy nhiên có giải pháp khác cho những bạn sử dụng phiên bản thấp hơn tại cuối bài viết.

Tạo danh sách các số ngẫu nhiên duy nhất

Để tạo ra danh sách các số ngẫu nhiên duy nhất là kết hợp 3 hàm mảng động mới: SORTBY, SEQUENCE và RANDARRAY:

SORTBY (SEQUENCE (n), RANDARRAY (n))

Trong đó n là số giá trị ngẫu nhiên bạn muốn nhận.

Ví dụ, để tạo một danh sách gồm 5 số ngẫu nhiên, hãy sử dụng 5 cho n:

= SORTBY (SEQUENCE (5), RANDARRAY (5))

Nhập công thức vào ô trên cùng, nhấn phím Enter và kết quả sẽ tự động trả về tại số ô được chỉ định.

Như bạn có thể thấy trong ảnh chụp màn hình bên dưới, công thức này thực sự sắp xếp các số từ 1 đến 5 theo thứ tự ngẫu nhiên.

Trước khi tìm hiểu về công thức trên, bạn nên đọc về hàm SEQUENCE

Trong công thức trên, bạn chỉ xác định có bao nhiêu hàng để điền. Tất cả các đối số khác được để giá trị mặc định của chúng, có nghĩa là danh sách sẽ bắt đầu từ 1 và bước tiến tăng dần là 1. Nếu bạn muốn một số đầu tiên và số tăng khác, thì hãy đặt giá trị của riêng bạn cho đối số thứ 3 (Start) và đối số thứ 4 (Step) của hàm SEQUENCE.

Ví dụ: để bắt đầu (Start) từ 100 và bước tiến (Step) 10, hãy sử dụng công thức sau:

= SORTBY (SEQUENCE (5, 100, 10), RANDARRAY (5))

Công thức này hoạt động như thế nào:

Ta sẽ bổ nhỏ công thức ra như sau:

· Hàm SEQUENCE tạo một mảng số tuần tự dựa trên giá trị bắt đầu (Start) được chỉ định hoặc mặc định và có đối số tăng dần. Chuỗi này chuyển đến đối số mảng của SORTBY.

Hãy nhớ rằng công thức đơn giản này tạo ra một danh sách các số ngẫu nhiên không lặp lại với một bước được xác định trước. Để vượt qua giới hạn này, hãy sử dụng phiên bản nâng cao của công thức được mô tả bên dưới.

Cách khác tạo danh sách các số ngẫu nhiên không trùng lặp

Chỉ hoạt động trong các phiên bản Excel 365 mới nhất hỗ trợ mảng động.

Tạo danh sách số nguyên ngẫu nhiên:

INDEX (UNIQUE (RANDARRAY (n * 2, 1, min, max, TRUE)), SEQUENCE (n))

Tạo danh sách số thập phân ngẫu nhiên:

INDEX (UNIQUE (RANDARRAY (n * 2, 1, min, max, FALSE)), SEQUENCE (n))

Ví dụ: để tạo danh sách 5 số nguyên ngẫu nhiên từ 1 đến 100 không có số lặp, hãy sử dụng công thức sau:

= INDEX (UNIQUE (RANDARRAY (10, 1, 1, 100, TRUE)), SEQUENCE (5))

Để tạo 5 số thập phân ngẫu nhiên duy nhất, hãy đặt FALSE trong đối số cuối cùng của RANDARRAY hoặc bỏ qua đối số này:

= INDEX (UNIQUE(RANDARRAY (10, 1, 1, 100)), SEQUENCE (5))

Công thức này hoạt động như thế nào:

Thoạt nhìn, công thức có thể hơi phức tạp, nhưng khi xem xét kỹ hơn, logic của nó rất đơn giản:

· Hàm RANDARRAY tạo một mảng các số ngẫu nhiên dựa trên các giá trị tối thiểu và tối đa mà bạn chỉ định. Để xác định có bao nhiêu giá trị cần tạo, bạn nhân số mong muốn ít nhất với 2 (vì mảng kết quả có thể có trên một mảng biết bao nhiêu bản sao sẽ được xử lý sau này). Trong ví dụ này, chúng ta chỉ cần 5 số ngẫu nhiên duy nhất nhưng buộc RANDARRAY tạo ra 10, sao cho UNIQUE có đủ giá trị để chọn.

Tạo một dải số ngẫu nhiên không lặp lại trong Excel

Chỉ hoạt động trong các phiên bản Excel 365 mới nhất hỗ trợ mảng động.

Để tạo một dải số ngẫu nhiên không có số lặp lại, hãy sửa đổi công thức trên theo cách này:

INDEX (UNIQUE (RANDARRAY (rows * 2, columns, min,max)), SEQUENCE (rows), {1,2,…})

· {1,2,…} là một hằng số mảng bao gồm các số / chỉ số của tất cả các cột được điền các giá trị ngẫu nhiên. Ví dụ, để điền vào 2 cột, hãy sử dụng hằng mảng {1,2}; để điền vào 3 cột, hãy sử dụng {1,2,3}, v.v.

Ví dụ: để điền vào phạm vi 10 hàng và 3 cột với các số ngẫu nhiên duy nhất từ 1 đến 100, hãy sử dụng công thức sau:

= INDEX (DUY NHẤT (RANDARRAY (20, 3, 1, 100)), SEQUENCE (10), {1,2,3})

CHỈ 7 GIỜ HỌC BÀI BẢN, TIẾP KIỆM HÀNG CHỤC NGHÌN GIỜ TRA CỨU

Và nó sẽ tạo ra một mảng các số thập phân ngẫu nhiên không có số lặp lại:

Nếu bạn cần số nguyên, thì hãy đặt đối số cuối cùng của RANDARRAY thành TRUE:

= INDEX (UNIQUE (RANDARRAY (20, 3, 1, 100, TRUE)), SEQUENCE (10), {1,2,3})

Cách ngăn các số ngẫu nhiên thay đổi

1. Chọn tất cả các ô có công thức ngẫu nhiên của bạn và nhấn Ctrl + C để sao chép chúng.

Cách tạo số ngẫu nhiên duy nhất trong phiên bản Excel 2019, 2016 trở về trước

Vì không có phiên bản nào ngoài Excel 365 hỗ trợ mảng động nên không có giải pháp nào ở trên hoạt động trong các phiên bản Excel trước. Tuy nhiên, điều này không có nghĩa là không có giải pháp nào cả, bạn chỉ cần thực hiện thêm một số bước sau:

1. Tạo một danh sách các số ngẫu nhiên. Dựa trên nhu cầu của bạn, hãy sử dụng:

Đảm bảo tạo nhiều giá trị hơn bạn thực sự cần vì một số giá trị sẽ bị trùng lặp và bạn sẽ xóa chúng sau đó.

Để nhập công thức vào nhiều ô cùng một lúc, hãy chọn tất cả các ô (A2: A15 trong ví dụ của chúng tôi), nhập công thức vào thanh công thức và nhấn Ctrl + Enter. Hoặc bạn có thể nhập công thức vào ô đầu tiên như bình thường, sau đó kéo công thức xuống bao nhiêu ô nếu cần.

Dù sao, kết quả sẽ giống như thế này:

Như bạn có thể nhận thấy, chúng tôi đã nhập công thức vào 14 ô, mặc dù cuối cùng chúng tôi chỉ cần 10 số ngẫu nhiên duy nhất.

Để đảm bảo bạn đã làm đúng, hãy chọn bất kỳ số nào và nhìn vào thanh công thức. Bây giờ nó sẽ hiển thị một giá trị, không phải một công thức:

Làm xong! Tất cả các bản sao đã biến mất và bây giờ bạn có thể xóa các số dư thừa.

Tài liệu kèm theo bài viết

Bạn đang đọc nội dung bài viết Cách Lọc, Xoá Data Trùng Lặp Trong File Excel trên website Beiqthatgioi.com. Hy vọng một phần nào đó những thông tin mà chúng tôi đã cung cấp là rất hữu ích với bạn. Nếu nội dung bài viết hay, ý nghĩa bạn hãy chia sẻ với bạn bè của mình và luôn theo dõi, ủng hộ chúng tôi để cập nhật những thông tin mới nhất. Chúc bạn một ngày tốt lành!