Skip to main content

Mi az optikai karakterfelismerés (OCR)?

15 OPTIKAI CSALÓDÁS AMI TESZTELI AZ AGYADAT! (GONDOLKODTATÓ ILLÚZIÓK) (Lehet 2024)

15 OPTIKAI CSALÓDÁS AMI TESZTELI AZ AGYADAT! (GONDOLKODTATÓ ILLÚZIÓK) (Lehet 2024)
Anonim

Az optikai karakterfelismerés (OCR) olyan szoftverre vonatkozik, amely a nyomtatott, gépelt vagy kézzel írott dokumentum digitális verzióját hozza létre, amelyet a számítógépek elolvashatnak anélkül, hogy manuálisan beírnák vagy be kellene írniuk a szöveget. Az OCR-t általában PDF formátumú, beolvasott dokumentumokban használják, de létrehozhat egy számítógépen olvasható szöveget egy képfájlban.

Mi az OCR?

Az OCR, amelyet szövegfelismerésnek is neveznek, olyan szoftvertechnológia, amely a nyomtatott vagy írásos dokumentumokból, például számokból, betűkből és írásjelekből (más néven glyphs) átírja az elektronikus formátumot, amely könnyebben felismerhető és olvasható számítógéppel és más szoftverprogramokkal. Bizonyos OCR-programok ezt a dokumentumot szkennelik vagy fényképezik digitális fényképezőgéppel, mások pedig ezt a folyamatot alkalmazhatják az olyan dokumentumokra, amelyeket korábban szkenneltek vagy fényképeztek OCR nélkül. Az OCR lehetővé teszi a felhasználók számára, hogy PDF dokumentumokban keressenek, szövegeket szerkesztenek, és újra formázzák a dokumentumokat.

Mi az OCR?

Gyors, napi beolvasási igények esetén az OCR nem lehet nagy ügy. Ha nagy mennyiségű szkennelést végez, a PDF-fájlok kereséséhez, hogy megtalálja a pontos leírást, időt takaríthat meg, és fontosabbá teheti az OCR funkciót a szkennerprogramban. Íme néhány más dolog, amellyel az OCR segít:

  • Automatizált adatfeldolgozás és adatbevitel (Példa: Álláskeresõ nyomkövetõ rendszerek folytatásához)
  • Beolvasott könyvek kereshetővé tétele
  • A kézzel írott beolvasások számítógéppel olvashatóvá válnak
  • A dokumentumok felhasználhatósága olyan olvasóprogramok számára, amelyek segítik a látássérült felhasználókat
  • Történelmi dokumentumok és újságok megőrzése, ugyanakkor kereshetővé tétele is
  • Adattovábbítás és számviteli programokba való átutalás (Példa: bevételek és számlák)
  • Indexelő dokumentumok a keresőmotorok számára
  • A vezető-rendszámtáblák felismerése sebességmérő kamerával és piros fényű fényképezőgép szoftverrel
  • Beszédszintetizátorok olyan emberek számára, akik nem tudnak beszélni - elméleti fizikus, Stephen Hawking talán a beszédszintetizáló program legelismertebb felhasználója

Miért használja az OCR-t?

Miért nem csak egy képet készítesz, ugye? Mert nem tudsz szerkeszteni semmit, vagy nem keresi a szöveget, mert csak egy kép lenne. A dokumentum beolvasása és az OCR szoftver futtatása a fájlt módosíthatja és kereshetővé teheti.

Az OCR története

Míg a legkorábbi szövegfelismerés 1914-re nyúlik vissza, az OCR-technológiák széles körben elterjedt fejlesztése és használata az 1950-es években komolyan kezdődött, különösen olyan egyszerűsített betűkészletek létrehozásával, amelyek könnyebben konvertálhatók a digitálisan olvasható szövegekké. Az első ilyen egyszerűsített betűkészletet David Shepard hozta létre, és az OCR-7B néven ismert. Az OCR-7B még ma is használatban van a pénzügyi ágazatban a hitelkártyákon és betéti kártyákon használt szabványos betűtípuson. Az 1960-as években a postai szolgáltatások számos országban elkezdték használni az OCR technológiát, hogy jelentősen felgyorsítsák az e-mailek válogatását, beleértve az Egyesült Államokat, Nagy-Britanniát, Kanadát és Németországot. Az OCR még mindig az a legfontosabb technológia, amellyel a postai küldeményeket világszerte rendezik. 2000-ben az OCR technológia korlátainak és lehetőségeinek kulcsfontosságú ismerete volt a CAPTCHA programok kifejlesztésére, amelyek a robotok és a spammerek megállítását szolgálják.

Az évtizedek során az OCR pontosabb és kifinomultabbá vált a kapcsolódó technológiai területeken, például a mesterséges intelligencia, a gépi tanulás és a számítógépes elképzelések terén. Ma az OCR szoftver a mintafelismerést, a funkciófelderítést és a szövegbányászatot használja a dokumentumok gyorsabb és pontosabb feldolgozására, mint valaha.