Távolítsa el a Duplicate Data Records Excel-t
Az Excel-t, például az Excel-t gyakran adatbázisokként használják olyan dolgokra, mint az alkatrész-készletek, az értékesítési rekordok és a levelezőlisták.
Az Excel adatbázisai olyan adatbázist foglalnak magukban, amelyet rendszerint adatrészletekként rendeznek.
A rekordban a sorban lévő cellák vagy mezők adatai kapcsolódnak egymáshoz - például a vállalat neve, címe és telefonszáma.
Az adatbázisban jelentkező gyakori probléma mérete az, hogy duplikált rekordok vagy adatsorok vannak.
Ez a duplikáció akkor fordulhat elő, ha:
- Az egész rekord többször kerül be az adatbázisba, így két vagy több azonos rekordot eredményez
- A több rekordnak egy vagy több mezője van, például egy név és cím, amely ugyanazokat az adatokat tartalmazza.
Bármelyik módon, az ismétlődő feljegyzések számos problémát okozhatnak - például a dokumentumok több példányának elküldését ugyanazon személynek, amikor az adatbázis-információkat egy levél egyesítés során használják -, ezért jó ötlet a rendszeres alapján.
És bár könnyű kiválaszthatja az ismétlődő feljegyzéseket egy kis mintában, mint például a fenti képen, az adatrekordok könnyen több százat is tartalmazhatnak, ha nem több ezer rekordot, így nagyon nehéz megismételni a dupla rekordot - különösen a részlegesen illeszkedő rekordokat.
A feladat végrehajtásának megkönnyítése érdekében az Excel egy beépített adatkezelő eszközzel rendelkezik, amely nem meglepő, Duplikátumok eltávolítása, amely azonos, valamint részlegesen illeszkedő rekordok megtalálására és eltávolítására is használható.
Azonban, ahogyan a Duplikátumok eltávolítása a szerszámot úgy tervezték, hogy azonos és részben egyező rekordokat külön kell kezelni.
Ez azért van, mert a Duplikátumok eltávolítása párbeszédpanel megjeleníti a kiválasztott adattáblázat mezőnevét, és kiválasztja azokat a mezőket, amelyeket be kell illesztenie a megfelelő rekordok kereséséhez:
- Az azonos rekordok esetén keressen az összes mezőt - hagyja el az oszlopok vagy mezőnevek melletti jelölőnégyzeteket;
- Részben összehangolt rekordok esetén - hagyja el a jelölőnégyzeteket csak az illeszkedő mezők mellett.
Mezőnevek és oszloplevelek
Amint említettem, a Duplikátumok eltávolítása eszköz egy párbeszédpanelből áll, ahol a kívánt mezők vagy oszlopok nevének ellenőrzésével választja ki a megfelelő mezők keresését.
A párbeszédablakban megjelenő információk - a mezőnevek vagy oszlopdiagramok - attól függnek, hogy az adatok tartalmazzák-e a sorok sorát - vagy fejlécek - az adat táblázat tetején, a fenti képen látható módon.
Ha igen - győződjön meg róla, hogy a párbeszédpanel jobb oldalán található opció - Az adataim fejlécekkel rendelkeznek - ki van kapcsolva, és az Excel a mezők nevében a párbeszédablakban jeleníti meg a sor nevét.
Ha az adataid nem tartalmaznak fejlécet, a párbeszédpanelen megjelenik a megfelelő oszlopbetűk a kiválasztott adatkapcsolat párbeszédpanelén.
Szomszédos adatkészlet
A Duplikátumok eltávolítása hogy az adatkezelő eszköz megfelelően működjön, az adattáblának egymás után következő adatsorának kell lennie - azaz nem szabad üres sorokat, oszlopokat és, ha lehetséges, nincsenek üres cellák a táblán belül.
Az adattáblán belül nincsenek üresek az általános adatkezelés terén, és nemcsak az ismétlődő adatok keresésekor. Az Excel egyéb adatkezelői eszközei - például a válogatás és a szűrés - a legjobban működnek, ha az adattáblázat az adatok egy sorozata.
Példány törlése duplikátumadatokkal
A fenti képen az adatlap két azonos rekordot tartalmaz A. Thompson és két részlegesen egyező rekordot R. Holt - ahol az összes mező illeszkedik, kivéve a hallgatói számot.
Az alábbi lépések részletesen leírják a Duplikátumok eltávolítása adat eszköz:
- Távolítsa el a két azonos rekord második részét A. Thompson .
- Távolítsa el a második részlegesen egyező rekordot R. Holt .
A Duplikák eltávolítása párbeszédpanel megnyitása
- Kattints bármelyik csomagra, amely adatokat tartalmaz a mintaadatbázisban.
- Kattints a Adat fül a szalagon.
- Kattintson a Duplikátumok eltávolítása ikonra, hogy kijelölje az adattáblázat összes adatait, és megnyitja a Duplikátumok eltávolítása párbeszédablak.
- A Duplikátumok eltávolítása párbeszédpanel megjeleníti az adatmintából az összes oszlopcímet vagy mezőnevet
- A mezőnevek melletti jelölőnégyzetek jelzik, hogy az Excel oszlopok hogyan próbálkoznak egymással a kettős rekordok kereséséhez
- Alapértelmezés szerint, ha megnyílik a párbeszédpanel, az összes mezőnevet kikapcsolják
Azonos rekordok keresése
- Mivel ebben a példában teljesen azonos rekordokat keresünk, az összes ellenőrzött oszlopot el kell hagyni
- Kattints rendben
Ezen a ponton a következő eredményeket kell látni:
- A párbeszédablaknak zárva kell lennie, és ki kell cserélnie egy üzenetet, amely így szól: 1 talált és eltávolított duplikált érték; 7 egyedi érték marad.
- A duplikátumot tartalmazó sor A. Thompson a rekordot eltávolították az adatbázisból
- Annak ellenére, hogy két részlegesen egyező rekord van R. Hol t, mert nem minden mező illeszkedik - a két nyilvántartás hallgatói száma különbözik - az Excel úgy tekinti, hogy ez egy egyedülálló adatrekord
Keresse meg és távolítsa el a részlegesen összehangolt rekordokat a másolatok eltávolításával
Egy mező egyidejű ellenőrzése
Mivel az Excel csak olyan adatrekordokat távolít el, amelyek pontosan megfelelnek a kiválasztott adatmezőknek, a legmegfelelőbb módja annak, hogy megtalálja az összes részlegesen egyező adatrekordot, eltávolítja a pipa csak egy mezőt egy időben, amint az az alábbi lépésekből következik.
A rekordok későbbi keresése, amelyek minden mezőben megegyeznek a név, az életkor vagy a program kivételével, eltávolít minden lehetséges kombinációt a részlegesen egyező rekordok számára.
Részben megegyező rekordok keresése
- Ha szükséges, kattintson az adatlapban lévő adatokat tartalmazó cellákra
- Kattints a Adat fül a szalagon.
- Kattintson a Duplikátumok eltávolítása ikonra, hogy kijelölje az adattáblázat összes adatait, és megnyitja a Duplikátumok eltávolítása párbeszédablak.
- Az adattáblához tartozó összes mezőnév vagy oszlopfejléc van kiválasztva.
- Azon rekordok kereséséhez és eltávolításához, amelyek nem egyeznek meg minden mezőben, távolítsa el a jelölőnégyzetet azokon a mezőneveken kívül, amelyeket az Excel figyelmen kívül hagy.
- Ehhez a példához kattintson a jelölőnégyzet melletti jelölőnégyzetre Diákigazolvány oszlop fejlécét, hogy eltávolítsa a pipa.
- Az Excel most csak olyan rekordokat keres és távolít el, amelyek megfelelnek a Vezetéknév , A kezdeti , és Program területeken.
- Kattints rendben
- A párbeszédablaknak zárva kell lennie, és ki kell cserélnie egy üzenetet, amely így szól: 1 talált és eltávolított duplikált érték; 6 egyedi érték marad.
- A második rekordot tartalmazó sor R. Holt a diák azonosítóval ST348-252 eltávolítva az adatbázisból.
- Kattints rendben az üzenetablak bezárásához
Ezen a ponton a példaadat-táblának mentesnek kell lennie minden ismétlődő adatról.