Skip to main content

Fjern Duplicate Rows of Data i Excel

Find og Fjern Dubletter i Excel (April 2025)

Find og Fjern Dubletter i Excel (April 2025)
Anonim
01 af 02

Fjern Duplicate Data Records i Excel

Regnearksprogrammer som Excel bruges ofte som databaser til ting som varefortegnelser, salgsposter og mailinglister.

Databaser i Excel består af data tabeller, der normalt er organiseret i rækker af data kaldet poster.

I en rekord er dataene i hver celle eller felt i rækken relateret - såsom firmaets navn, adresse og telefonnummer.

Et almindeligt problem, der opstår som en database vokser i størrelse, er, at der er duplikatoptegnelser eller rækker af data.

Denne overlapning kan forekomme, hvis:

  • Hele poster registreres mere end én gang i databasen, hvilket resulterer i to eller flere identiske poster
  • Flere poster har et eller flere felter - f.eks. Et navn og en adresse - indeholdende de samme data.

På samme måde kan duplikatregistre medføre en lang række problemer - som f.eks. At sende flere kopier af dokumenter til samme person, når databaseoplysningerne bruges i en mailfusion - så det er en god ide at scanne og fjerne dublette poster på en regelmæssig måde basis.

Og mens det er nemt at udvælge dublette poster i en lille prøve som den i billedet ovenfor, kan datatabeller nemt indeholde hundreder, hvis ikke tusindvis af poster gør det meget svært at vælge duplikatoptegnelser - især delvist matchende poster.

For at gøre det nemmere at udføre denne opgave har Excel et indbygget dataredskab kaldet ikke overraskende, Fjern duplikater, som kan bruges til at finde og fjerne identiske såvel som delvist matchende poster.

Men den måde den Fjern duplikater værktøjet er designet, identiske og delvist matchende poster skal behandles separat.

Dette skyldes, at Fjern duplikater dialogboksen viser feltnavne for den valgte datatabel, og du vælger hvilke felter der skal inkluderes i søgen efter matchende poster:

  • For identiske poster, søg efter alle felter - forlad markeringer ud for alle kolonne- eller feltnavne;
  • For delvist matchende poster - forlad markeringer ud for kun de felter, der skal matches.

Feltnavne vs. kolonnebrev

Som nævnt, den Fjern duplikater værktøj består af en dialogboks hvor du vælger hvilke matchende felter der skal søges ved at tjekke det ønskede felt eller kolonne navn.

De oplysninger, som dialogboksen viser - feltnavne eller søjlebreve - afhænger af, om dine data indeholder en række overskrifter - eller overskrifter - øverst i datatabellen som set i billedet ovenfor.

Hvis det gør det - sørg for, at indstillingen på højre side af dialogboksen - Mine data har overskrifter - er afkrydset og Excel vil vise navnene i denne række som feltnavne i dialogboksen.

Hvis dine data ikke har en headerrække, vil dialogboksen vise de relevante kolonner i dialogboksen for det valgte datasort.

Sammenhængende dataområde

For Fjern duplikater værktøj til at fungere ordentligt, skal datatabellen være en sammenhængende række data - det må ikke indeholde tomme rækker, kolonner og, hvis det ikke er muligt, ingen tomme celler placeret i tabellen.

Det er en god praksis, når det gælder datahåndtering generelt, og ikke kun når du søger efter duplikatdata, uden at have blanke i en datatabel. Excels andre dataredskaber - f.eks. Sortering og filtrering - fungerer bedst, når datatabellen er en sammenhængende række data.

Fjern Duplicate Data Records Eksempel

I billedet ovenfor indeholder datatabellen to identiske poster for A. Thompson og to delvist matchende poster til R. Holt - hvor alle felter matcher bortset fra studentenummeret

De trin, der er angivet nedenfor, beskriver, hvordan du bruger Fjern duplikater dataredskab til:

  1. Fjern den anden af ​​to identiske poster for A. Thompson .
  2. Fjern den anden delvist matchende post for R. Holt .

Åbner dialogboksen Fjern duplikater

  1. Klik på en celle, der indeholder data i prøvedatabasen.
  2. Klik på knappen Data fane på båndet.
  3. Klik på Fjern duplikater ikon for at markere alle data i datatabellen og for at åbne Fjern duplikater dialog boks.
  4. Det Fjern duplikater dialogboksen viser alle kolonneoverskrifter eller feltnavne fra vores datasample
  5. Afkrydsningsfelterne ud for feltnavne angiver, hvilke kolonner Excel vil forsøge at matche i søgning efter duplikatoptegnelser
  6. Som standard åbnes alle feltnavn, når dialogboksen åbnes

Find identiske optegnelser

  1. Da vi søger helt identiske poster i dette eksempel, vil vi lade alle kolonneoverskrifter kontrolleres
  2. Klik Okay

På dette tidspunkt skal følgende resultater ses:

  • Dialogboksen skal lukkes og erstattes af en meddelelse, der siger: 1 duplikatværdier fundet og fjernet 7 unikke værdier forbliver.
  • Rækken indeholdende duplikatet A. Thompson posten er blevet fjernet fra databasen
  • Selvom der er to delvist matchende poster til R. Hol t, fordi ikke alle felter matchede - Studentenummeret for de to poster adskiller sig - Excel anser det for at være en unik datapost
02 af 02

Find og fjern delvis matchende poster med fjern duplikater

Kontrol af ét felt ad gangen

Da Excel kun fjerner dataposter, der svarer til de valgte datafelter, er den bedste måde at finde alle delvist matchende dataposter på, at fjerne markeringen for kun ét felt ad gangen, som det sker i trinene nedenfor.

Efterfølgende søgninger efter poster, der matcher i alle felter undtagen navn, alder eller program fjerner alle mulige kombinationer til delvist matchende poster.

Finde delvist matchende poster

  1. Klik på en celle, der indeholder data i datatabellen, hvis det er nødvendigt
  2. Klik på knappen Data fane på båndet.
  3. Klik på Fjern duplikater ikon for at markere alle data i datatabellen og for at åbne Fjern duplikater dialog boks.
  4. Alle feltnavne eller kolonneoverskrifter for datatabellen er valgt.
  5. For at finde og fjerne poster, der ikke har en match i alle felter, skal du fjerne markeringen ud for de felter, som Excel skal ignorere.
  6. For dette eksempel skal du klikke på afkrydsningsfeltet ved siden af studiekort kolonneoverskrift for at fjerne markeringen.
  7. Excel vil nu kun søge og fjerne poster, der har matchende data i Efternavn , Initial , og Program felter.
  8. Klik Okay
  9. Dialogboksen skal lukkes og erstattes af en meddelelse, der siger: 1 duplikatværdier fundet og fjernet 6 unikke værdier forbliver.
  10. Rækken indeholdende den anden rekord for R. Holt med Student ID for ST348-252 vil være blevet fjernet fra databasen.
  11. Klik Okay for at lukke meddelelsesboksen

På dette tidspunkt bør eksempeldatatabellen være fri for alle duplikatdata.