OqPoWah.com

Napredno iskanje in jezik poizvedbe. Jezik iskalnika

Jezik poizvedbe je umetno ustvarjen programski jezik, ki se uporablja za izdelavo poizvedb v bazah podatkov in informacijskih sistemih.

jezik poizvedbe

Na splošno lahko takšne metode poizvedb se razvrstijo glede na to, ali se uporabljajo za zbirke podatkov, ali iskanje informacij. Razlika je v tem, da so zahteve za tovrstne storitve zavzema za zagotavljanje dejanske odgovore na ta vprašanja, medtem ko je iskalnik poskuša najti dokumente, ki vsebujejo podatke o uporabniku zanima na tem področju.

Baze podatkov

Jeziki poizvedb za zbirke podatkov vključujejo naslednje primere:

  • QL - objektno usmerjen, se nanaša na relacijske podatkovne baze - naslednik Datalog.
  • Kontekstualno (CQL) je uradni izraz za poizvedbe poizvedb za sisteme za iskanje informacij (npr. Spletni indeksi ali bibliografski imeniki).
  • CQLF (CODYASYL) - za podatkovne zbirke CODASYL-TYPE.
  • Konceptno usmerjen jezik poizvedb (COQL) se uporablja v ustreznih modelih (com). Temelji na načelih modeliranja podatkovnih modelov in uporablja takšne operacije, kot so projekcija in de-projekcija večdimenzionalne analize, analitičnih operacij in sklepov.
  • DMX - uporablja se za modele podatkovnega rudarjenja.
  • Datalog je jezik poizvedb deduktivnih podatkovnih baz.
  • Gellish angleščina je jezik, ki se lahko uporablja za poizvedbe v Gellish angleških zbirkah podatkov in vam omogoča, da vodite pogovorna okna (poizvedbe in odgovore) in tudi služi za informacijsko modeliranje znanje.
  • HTSQL - prevaja HTTP zahteve v SQL.
  • ISBL - uporablja se za PRTV (eno od prvih relacijskih sistemi za upravljanje baz podatkov).
  • LDAP je protokol za zahteve in imeniške storitve, ki potekajo prek TCP / IP.
  • MDX je potreben za podatkovne baze OLAP.

Yandex jezik poizvedbe

Iskalniki

Jezik iskalnih poizvedb je namenjen iskanju podatkov v iskalnikih. To se razlikuje tako, da pogosto zahtevajo navadno besedilo ali hipertekst z dodatno sintakso (na primer "in" / "ali"). Znatno se razlikuje od standardnih podobnih jezikov, ki jih urejajo stroga pravila sintakse ukazov ali vsebujejo pozicijske parametre.

Kako so iskalne poizvedbe razvrščene?

Obstajajo tri široke kategorije, ki pokrivajo večino iskalnih poizvedb: informacije, navigacijo in transakcije. Čeprav ta razvrstitev ni bila teoretično določena, je bila empirično potrjena s prisotnostjo dejanskih poizvedb v iskalnikih.

Zahteve za informacije so tiste, ki zajemajo široke teme (na primer določen model mesta ali tovornjaka), za katere je na voljo več tisoč ustreznih rezultatov.

Navigacija - to so poizvedbe, ki iščejo eno spletno mesto ali spletno stran za določeno temo (na primer, YouTube).

jezik iskalnih poizvedb

Transakcijski - odražajo namero uporabnika, da izvede določeno dejanje, na primer naredi nakup avtomobila ali rezervira vozovnico.

Iskalniki pogosto podpirajo četrto vrsto poizvedbe, ki se uporablja veliko manj pogosto. To so ti zahtevki za povezavo, ki vsebujejo poročilo o povezljivosti indeksirane spletne grafike (število povezav do določenega URL-ja ali koliko strani so indeksirane iz določene domene).

Kako se izvede pridobivanje informacij?

Večina iskalnih virov ne razkrije svojih iskalnih dnevnikov, zato je zelo težko najti informacije o tem, kaj uporabniki iščejo v spletu. Kljub temu so se prve znanstvene raziskave pojavile leta 1998. Kasneje je bila v letu 2001 opravljena naknadna raziskava, ki je analizirala poizvedbe, ki so bile prikazane kot zelo pomembne. Postalo je tudi jasno, kako iskanje robotov jezik poizvedbe.

Znane so zanimive značilnosti, povezane s spletnim iskanjem:

Povprečna dolžina iskalne poizvedbe je bila 2,4 besed.

  • Približno polovica uporabnikov je poslala eno zahtevo in nekaj manj kot tretjina uporabnikov je naredila tri ali več unikatnih poizvedb.
  • Skoraj polovica uporabnikov si je ogledala samo prvo ali dve strani rezultatov.
  • Manj kot 5% uporabnikov uporablja napredne možnosti iskanja (na primer izbiro določenih kategorij ali iskanje v iskanju).

Značilnosti ukrepov po meri

Študija je tudi pokazala, da je 19% vprašanj vsebovalo geografski izraz (na primer imena, poštne številke, geografski objekti itd.). Omeniti je treba tudi, da so poleg kratkih poizvedb (to je z več pogoji) pogosto prisotne predvidljive sheme, po katerih so uporabniki spremenili svoje fraze iskanja.

logični poizvedbeni jezik

Ugotovljeno je bilo tudi, da se 33% zahtev iz enega uporabnika ponovi in ​​v 87% primerih bo uporabnik kliknil isti rezultat. To kaže, da mnogi uporabniki uporabljajo ponavljajoče se zahteve za pregled ali ponovno poiskanje informacij.

Porazdelitve frekvenčnih poizvedb

Poleg tega so strokovnjaki potrdili, da frekvenčna porazdelitev poizvedb ustreza zakonu o moči. To pomeni, da je v največjem seznamu zahtevkov (na primer več kot 100 milijonov) opazen majhen del ključnih besed in se najpogosteje uporabljajo. Preostale fraze v istih predmetih se uporabljajo manj pogosto in bolj individualno. Ta pojav se imenuje Načelo Pareto (Ali "pravilo 80-20"), in ga je mogoče uporabiti take iskalniki tehnik za optimizacijo kot indeksiranja ali delitev baze podatkov, predpomnjenje in prednapetost, in tudi priložnost za izboljšanje jezik poizvedb iskalnika.

V zadnjih letih je bilo ugotovljeno, da se povprečna dolžina poizvedbe sčasoma nenehno povečuje. Tako je povprečna poizvedba v angleščini postala daljša. V zvezi s tem je Google predstavil posodobitev z imenom »Hummingbird« (avgust 2013), ki je sposobna izpeljati dolge fraze iskanja z brez protokola "govorijo" izraz jezik (na primer: »Kje je najbližja kavarna?").




zahteva v angleščini

Za daljše poizvedbe se uporablja njihova obdelava - razdeljeni so v fraze, oblikovane v standardnem jeziku, odgovori na različne dele pa so prikazani ločeno.

Strukturirane poizvedbe

Iskalniki, ki podpirajo logične operacije in sintakso, uporabite več razširjenih jezikov poizvedb. Uporabnik, ki išče dokumente, ki pokrivajo več tem ali obrazov, lahko vsako od njih opisuje z logično karakterizacijo besede. V jedru je jezik logičnega poizvedovanja zbirka posebnih fraz in ločil.

Kaj je napredno iskanje?

Jezik "Yandex" in "Google" poizvedbe lahko izvaja bolj usmerjeno iskanje, pod določenimi pogoji. Napredno iskanje lahko poiščete ime strani ali pa uporabite glavo predpone, kot tudi v nekaterih kategorij in sezname imen. Lahko tudi omeji iskanje strani, ki vsebujejo določene besede v naslovu ali so v določenih skupinah tem. Ob pravilni uporabi, jezik izraz zmorem parametre red velikosti bolj zapletene od površine izdajanja večini iskalnikov, vključno z uporabniško določenimi besedami na koncu spremenljivke in isto črkovanje. Ob predložitvi ekspandirani rezultati iskanja bodo prikazani kot povezave na ustrezne dele strani.

jezik iskalnika

Prav tako je mogoče iskati vse strani, ki vsebujejo določeno frazo, medtem ko se s standardno poizvedbo iskalniki ne morejo ustaviti na kateri koli strani razprave. V mnogih primerih jezik poizvedbe lahko privede do katere koli strani, ki se nahaja v oznakah noindex.

V nekaterih primerih dobro oblikovan poizvedba vam omogoča iskanje informacij, ki vsebujejo številne posebne znake in črke iz drugih abeced (kitajski npr. hieroglifi).

Kako se preberejo znaki jezika poizvedbe?

Zgornji in spodnji rob ter nekateri diakritični znaki (umlauts in naglasi) niso vključeni v iskanje. Na primer, iskanje ključne besede Citroen ne najde strani, ki vsebujejo besedo "Citroen". Nekatere ligature pa ustrezajo posameznim črkam. Na primer, iskanje besede "aeroscope" enostavno najde strani, ki vsebujejo "Ereskebing" (AE = Æ).

Veliko ne-alfanumeričnih znakov se neprestano prezre. Na primer, ni mogoče najti informacij o poizvedbi, ki vsebuje niz | L | (V pismu med dvema navpične črte), kljub dejstvu, da se ta simbol uporablja v nekaterih predloge za pretvorbo. V rezultatih bodo le podatki iz LT. Nekateri simboli in fraze se obravnavajo na različne načine: poizvedba "posojilo (Finance)" prikaže članek z besedami "kredit" in "finance", ignorira nosilce, čeprav je članek s takim imenom "kreditna (Finance)".

jezike za poizvedbe za zbirke podatkov

Obstaja veliko funkcij, ki se lahko uporabljajo z jezikom poizvedbe.

Sintaksa

Jezik poizvedb »Yandex« in »Google« lahko uporabita nekaj ločil za izboljšanje iskanja. Na primer, zakrivljeni oklepaji so {{iskanje}}. Besedna zveza, ki je v njih vnesena, bo iskala v celoti, brez sprememb.

Stavek v dvojnih narekovajev vam omogoča, da določite predmet iskanja. Na primer, citirana beseda bo prepoznana kot uporabljena figurativno ali kot izmišljeni znak, brez navedb - kot informacije z bolj dokumentarnimi značilnostmi.

Poleg tega vsi večji iskalniki podpirajo znak ";" za logično "ne", kot tudi in / ali. Izjema so izrazi, ki jih ni mogoče ločiti s predpono črte ali črtice.

Nenatančna korespondenca iskalnega izraza je označena s simbolom ~. Na primer, če se ne spomnite natančnega besedila izraza ali naslova, ga lahko podate v iskalnem nizu z določenim znakom in rezultati boste dosegli z največjo podobnostjo.

Parametri iskanja po meri

Obstajajo tudi iskalni parametri, kot so intitle in incategory. To so filtri, prikazani skozi debelo črevo, v obliki "filter: poizvedbeni niz". Vrstica poizvedb lahko vsebuje iskalni izraz ali besedno zvezo ali del imena ali celotne strani.

Funkcija "intitle: query" daje prednost rezultatu iskanja po imenu, prikaže pa tudi običajne rezultate za vsebino naslova. Več takih filtrov se lahko uporablja hkrati. Kako izkoristiti to priložnost?

Zahteva za ime "intitle: airport name" bo v naslovu vsebovala vse članke z naslovom letališča. Če jo sestavite kot "parkirno intitle: ime letališča", boste prejeli članke z imenom letališča v naslovu in omenjali parkiranje v besedilu.

Iskanje filtra "kategorija: Kategorija" deluje po načelu začetne izdaje člankov, ki pripadajo določeni skupini ali seznamu strani. Na primer, iskalna poizvedba za tip »Vključitev templja: zgodovina« bo ustvarila rezultate o zgodovini templjev. Ta funkcija se lahko uporablja tudi kot razširjena z nastavitvijo različnih parametrov.

Zdieľať na sociálnych sieťach:

Príbuzný