Skip to main content

A 'Ngram Viewer' eszköz használata a Google Könyvekben

N Grams Models Simple Example (Június 2026)

N Grams Models Simple Example (Június 2026)
Anonim

A Ngram, amelyet gyakran N-gramnak is neveznek, statisztikai elemzés a szöveges vagy beszédtartalomnak n (egy szám) valamilyen elemet a szövegben.

A keresési elem lehet mindenféle dolog, például fonémák, előtagok, kifejezések vagy betűk. Bár az N-gram némileg homályos a kutatóközösségen kívül, számos területen használják, és sok hatással van a fejlesztők számára olyan számítógépes programok kódolására, amelyek megértik és reagálnak a természetes beszédre.

A Google Könyvek Ngram Viewer esetében az elemezni kívánt szöveg nagy mennyiségű könyvből származik, amelyet a Google beolvasta a közkönyvtárakból a Google Könyvek keresőmotorjának feltöltéséhez. A Google Könyvek Ngram Viewer esetében azok a szövegek, amelyekre a keresést keresni fogják test . A Ngram Viewer nyelvek szerint aggregálódik, bár külön-külön elemezheti a brit és amerikai angol nyelveket, vagy összefoglalhatja őket.

Hogyan működik a Ngram

  1. Lépjen a Google Books Ngram Viewer könyvtárba a books.google.com/ngrams címen.

  2. Írja be az elemezni kívánt kifejezéseket vagy kifejezéseket. Minden egyes mondatot elválasszunk vesszővel. A Google azt javasolja, "Albert Einstein, Sherlock Holmes, Frankenstein", hogy elinduljon. A cikkek különböznek a Google webes kereséseitől.

  3. Írjon be egy dátumtartományt. Az alapértelmezett érték 1800 és 2000 között van.

  4. Válasszon egy korpuszt. Meg lehet keresni idegen nyelvű szövegeket vagy angolul, és a szokásos választásokon kívül észreveheti az olyan dolgokat, mint az "angol (2009) vagy az amerikai angol (2009)". Ezek a régebbi korpuszok, amelyeket a Google azóta frissített, de lehet, hogy valamilyen oknál fogva összehasonlíthatja a régi adathalmazokat. A legtöbb felhasználó figyelmen kívül hagyhatja őket, és a legfrissebb korpuszokra összpontosít.

  5. Állítsa be simítási szintjét. A simítás azt jelenti, hogy a görbe sima legyen a végén. A legpontosabb reprezentáció a 0 kiegyenlítő szintje lenne, de ez a beállítás nehezen olvasható. Az alapértelmezett érték 3. A legtöbb esetben nem kell módosítani.

  6. megnyomni a Sok könyvet keres gomb.

A Google lehetővé teszi, hogy eléggé fúrjon egy kicsit a Ngram Viewert. Ha szeretne halat keresni az ige helyett a halat a névvel, ezt megteheti címkék használatával. Ebben az esetben a "fish_VERB"

A Google teljes listát nyújt a használni kívánt parancsokról és egyéb speciális dokumentációkról a webhelyükön.

Mit mutat Ngram?

A Google Könyvek A Ngram Viewer olyan grafikont jelenít meg, amely a könyvekben egy adott kifejezés használatát jelenti időnként. Ha több szót vagy kifejezést adott meg, akkor színkódolt vonalak jelenik meg a különböző keresési kifejezésekkel. Ez nagyon hasonlít a Google trendjeihez, csak a keresés hosszabb ideig terjed.

Esettanulmány

Vegye figyelembe az ecet pékek esettanulmányát. Őket említik a Laura Ingalls Wilder-ben Kis ház a Prairie-ben sorozat. A Google webes keresésével foglalkozva, hogy többet megtudjon az ecetpelyhekről, kiderül, hogy az amerikai déli konyha részét képezik, és valójában ecetből készültek. Visszajátszanak olyan időkbe, amikor nem mindenki jutott friss termékekhez az év minden szakában. De ez az egész történet?

Keresés a Google Ngram Viewer számára ecet pite és az 1800-as korai és az 1800-as évek végén megemlítik a pite néhány megemlítését, az 1940-es években sok említést és az elmúlt időkben egyre több említést. Azonban 3-os simítási szinttel az 1800-as években megemlítjük a fennsíkot. Mivel ebben az időben nincs sok könyv megjelent, és mivel az adataink simaak, ezért torzítja a képet. Valószínűleg volt egy könyve, amely megemlítette az ecet pite-t, és csak átlagolt, hogy elkerülje a tüske. Ha a simítást 0-ra állítjuk, láthatjuk, hogy pontosan ez a helyzet. A tüske központja 1869-ben, és van egy másik tüske 1897-ben és 1900-ban.

Nem valószínű, hogy az ecet pite-ről senki sem beszélt az idő múlásával: Valószínűleg mindenütt lebegtek a receptek, de az emberek nem ír róluk könyvekben, és ez fontos korlátozás ezekre az Ngram keresésekre.