Skip to main content

Како да користите алатку 'Нграм Виевер' у Гоогле књигама

Anonim

Нграм, који се обично назива и Н-грам, представља статистичку анализу садржаја текста или говора н (број) неке врсте предмета у тексту.

Ставка за претрагу може бити свака од ствари, као што су фонеми, префикси, фразе или слова. Иако је Н-грам нешто нејасан изван истраживачке заједнице, користи се у различитим областима и има много импликација за програмере који кодирају рачунарске програме који разумеју и реагују на природни говорни језик.

У случају Гоогле Боокс Нграм Виевер, текст који треба анализирати долази из огромне количине књига које је Гоогле скенирао из јавних библиотека да попуњавају свој претраживач Гоогле књига. За Гоогле Боокс Нграм Виевер, они се односе на текст који ћете претраживати као корпус . Нграм Виевер се агрегира по језику, мада можете засебно анализирати британски и амерички енглески или их заједно спојити.

Како Нграм ради

  1. Идите на Гоогле Боокс Нграм Виевер на боокс.гоогле.цом/нграмс.

  2. Унесите било коју фразу или фразе које желите анализирати. Раздвојите сваку фразу са зарезом. Гоогле сугерише, "Алберт Ајнштајн, Шерлок Холмс, Франкенштајн" да бисте започели. Ставке су осетљиве на величину слова, за разлику од Гоогле претраживања веба.

  3. Укуцајте временски период. Подразумевано је 1800 до 2000.

  4. Изабери корпус. Можете претраживати текстове страних језика или енглески, а поред стандардних избора, на дну можете приметити ствари попут "Енглески (2009) или Амерички енглески (2009)". Ово су старији корпуси од којих је Гоогле још више ажурирао, али можда имате неки разлог да направите упоређивање са старим скуповима података. Већина корисника их може игнорисати и фокусирати се на најновије корпоре.

  5. Подесите ниво поравнања. Глатко се односи на то колико је глатко графикон на крају. Најтачнија репрезентација би била ниво поравнања од 0, али та поставка може бити тешка за читање. Подразумевано је подешено на 3. У већини случајева, не морате га подесити.

  6. притисните Потражи много књига дугме.

Гоогле вам дозвољава да се мало смањите помоћу Нграм Виевера. Ако желите претраживати рибу глагол уместо рибе именице, можете то учинити користећи ознаке. У овом случају, тражили бисте "фисх_ВЕРБ"

Гоогле пружа комплетну листу команди које можете користити и друге напредне документе на њиховој веб локацији.

Шта је Нграм показао?

Гоогле Боокс Нграм Виевер ће изаћи графикон који представља употребу одређене фразе у књигама кроз време. Ако сте унели више од једне речи или фразе, видећете линије у боји за контраст различитих термина за претраживање. Ово је прилично слично Гоогле трендовима, само претраживање обухвата дужи временски период.

Истраживање случаја

Узмите у обзир студију случаја пите за сирће. Споменуте су у Лаури Ингаллс Вилдер'с Мала кућа на Праири серије. Истраживањем са Гооглеовим претраживањем Веба како би сазнали више о питећим пите откривено је да се сматрају делом америчке Јужне кухиње и стварно су направљене од сирћета. Они се чувају уназад када нико није имао приступ свежем производу током читаве године. Али да ли је то цела прича?

Тражи Гоогле Нграм Виевер за пита од сирћета и наићи ћете на неке помињања пите у раним и касним 1800-им, пуно помена у 1940-им и све већи број помињања у последње време. Међутим, са нивоом поравнања од 3, видећете плато у односу на ометање у 1800-им. Због тога што у то доба није пуштено пуно књига, а због тога што су наши подаци постављени да се изједначава, то искривљује слику. Вероватно је постојала једна књига која је помињала питу пшенице, и управо се уверио да би се избегао класик. Постављањем померања на 0, видимо да је управо то случај. Спике се креће 1869. године, а 1897. и 1900. године постоји још један скок.

Мало је вероватно да нико није разговарао о сирћету питу остатак времена: било је вероватно да рецепти плутају по целом мјесту, али људи једноставно нису пиши о њима у књигама, и то је важно ограничење ових Нграм претраживања.