Nykymaailmassa XPath on edelleen yhteiskunnalle erittäin tärkeä ja kiinnostava aihe. XPath on edelleen keskustelun ja pohdinnan kohteena kaikenikäisille ja -taustaisille ihmisille, olipa se sitten talouteen, jokapäiväiseen elämään tai yhteiskunnalliseen merkitykseen johtuen. Kautta historian XPath:llä on ollut keskeinen rooli siinä, miten suhtaudumme ympäröivään maailmaan, ja sen tutkiminen ja ymmärtäminen ovat edelleen perustavanlaatuisia nyky-yhteiskunnan toiminnan ymmärtämisessä. Tässä artikkelissa tutkimme erilaisia näkökohtia, jotka liittyvät XPath:een ja sen vaikutuksiin modernin elämän eri osa-alueilla.
XPath (lyhenne sanoista XML Path Language) on ei-XML-pohjainen kieli XML-dokumenttien osien osoittamiseen ja XML-dokumentin rakenteeseen perustuvan tiedon luontiin[1]. XPath-kieli perustuu XML-dokumentin puumuotoiseen esitystapaan ja antaa siten mahdollisuuden poimia eri osia dokumentista tietyillä valintakriteereillä. XPath kehitettiin halusta saada yhtenäinen syntaksi ja käyttäytymismalli XPointerin ja XSL:n välille. Kehittäjät ovat nopeasti ottaneet XPathin käyttöönsä pienenä kyselykielenä.
Yleisin XPath-lauseke on polkulauseke, josta kieli on saanut nimensä. Polkulauseke koostuu peräkkäisistä askeleista, joilla päästään XML-solmusta yhteen tai useampaan toiseen solmuun. Askeleet erotetaan toisistaan vinoviivalla, ”/”. Jokaisessa askeleessa on vähintään kaksi osaa:
Näistä viimeinen eli predikaatti on vapaaehtoinen osa, mutta niitä voi olla useita peräkkäin. Komponentit esiintyvät yllä luetellussa järjestyksessä. Akselimäärittely ja solmutesti erotetaan tosistaan kahdella kaksoispisteellä ::
, predikaatit erotetaan kirjoittamalla kukin niistä hakasulkeiden sisään.
Tarjolla on kaksi eri merkintätapaa. Lyhennetty syntaksi on tiiviimpi ja usein helpompi lukea ja kirjoittaa – usein tutuilla merkeillä ja rakenteilla. Täysi syntaksi on monisanaisempi, mutta sen avulla voi määritellä enemmän asetuksia.
Tiivis merkintätapa sallii joitain oletuksia ja lyhenteitä. Yksinkertaisin XPath-lauseke on muotoa /A/B/C
, joka valitsee XML-juurielementin A lapsielementtien B lapsielementit C. XPathin syntaksi on suunniteltu muistuttamaan URI:n ja tiedostopolkujen syntaksia.
Monimutkaisempia lausekkeita voi muodostaa muun muassa määrittelemällä:
Esimerkiksi lauseke A//B/*
valitsee ensimmäisen () minkä tahansa nimisen elementin (
*
), joka on lapsi (/
) elementille B, joka taas itsessään on elementin A jälkeläinen (//
), joka on nykyisen kontekstisolmun lapsi, koska koko lauseke ei ala merkillä /
tai muulla akselimäärittelyllä.
Lyhentämättömässä syntaksissa yllä olevat esimerkit näyttävät tältä:
/child::A/child::B/child::C
jachild::A/descendant-or-self::node()/child::B/*
joka on sama kuin child::A/descendant::B/*
.Jokaisessa askeleessa akseli on määritelty eksplisiittisesti: child
tai descendant-or-self
). Akselia seuraa ::
ja solmutesti, kuten A
tai node()
yllä olevissa esimerkeissä.
Valinnan tyyppi | Lyhennetty syntaksi | Täysi syntaksi |
---|---|---|
Valitse kontekstisolmun lapsielementti nimeltä "nimi" | nimi (lapsi on oletussuunta) |
child::nimi
|
Valitse nykyisen puun juuri ja kaikki sen jälkeläiset | // |
/descendant-or-self::node()/
|
Valitse nykyinen solmu | . |
self::node()
|
Valitse ylemmän tason solmu | .. |
parent::node()
|
Valitse attribuutti nimeltä "nimi" | @nimi |
attribute::nimi
|
Akselimäärittely ilmaisee liikkumissuuntaa XML-dokumentin puumaisessa esitystavassa. Mahdolliset akselimäärittelyt ja niiden merkitykset ovat:
Nimi | Selitys |
---|---|
ancestor | Esivanhempi |
ancestor-or-self | Esivanhempi tai nykyinen |
attribute | Attribuutti |
child | Lapsi |
descendant | Jälkeläinen |
descendant-or-self | Jälkeläinen tai nykyinen |
following | Tuleva |
following-sibling | Tuleva sisar |
namespace | Nimiavaruus |
parent | Vanhempi |
preceding | Edeltävä |
preceding-sibling | Edeltävä sisar |
self | Nykyinen solmu |
Esimerkkinä attribute-akselin käytöstä, //a/@href
valitsee attribuutin nimeltä href
dokumentin miltä tahansa a
elementiltä. Suuntaa self käytetään usein predikaatissa viittaamaan kontekstisolmuun. Esimerkiksi h3
valitsee elementin nimeltä h3
, jonka tekstisisältö on Katso myös
.
Jos XML-dokumentti piirretään puumuotoon, akselit jakavat dokumentin neljään erilliseen lohkoon: vaakatasossa preceding–following -akselilla ja pystytasossa ancestor–descendant -akselilla. Syntaksin näkökulmasta preceding
sisältää elementit, joiden lopputagi on jo tullut vastaan ja following
elementit, joiden alkutagi ei ole vielä tullut vastaan (pois lukien jälkeläiset). Vastaavasti ancestor
vastaa avoinna olevia elementtejä, ja descendant
kontekstisolmusta avattavia elementtejä.
Elementtien, attribuuttien ja nimiavaruuksien kohdalla solmutesti muodostuu kohteen nimestä. Muilla tyypeillä se koostuu solmun tyyppiä vastaavasta solmutestistä.
Kun XPath-askeleessa solmutestinä on kohteen nimi, viittaa nimi oletuksena aina kohteeseen, jolle ei ole määritelty mitään nimiavaruutta. Haettaessa johonkin nimiavaruuteen kuuluvaa elementtiä tai attribuuttia, pitää solmutestissä aina käyttää nimiavaruusetuliitettä, joka erotetaan kaksoispisteellä nimestä. Tämä pätee vaikkei kohteella dokumentissa olisikaan etuliitettä vaan se kuuluisi oletusnimiavaruuteen. Nimiavaruusetuliitteen ei tarvitse olla sama, mitä dokumentissa mahdollisesti käytetty etuliite. Esimerkiksi jos nimiavaruudelle on määritelty etuliite gs
, niin //gs:enquiry
löytää kaikki enquiry
-nimiset solmut siitä nimiavaruudesta. XPath-kieli ei ota kantaa miten nimiavaruus sidotaan etuliitteeseen vaan se riippuu käytettävästä ohjelmointiympäristöstä.
Solmun tyyppiä vastaavat testit ovat:
<!-- Comment -->
.<k>terve</k>
.<?php echo $a ?>
. Tässä tapauksessa processing-instruction('php') olisi tarkempi lauseke mainitun solmun löytämiseen.Predikaatti on vapaaehtoinen osa XPath-askelta. Predikaatti on suodatusehdon tavoin toimiva hakasulkeiden sisällä oleva XPath-lauseke, jonka tulee olla tosi, jotta solmu tulee valituksi mukaan solmujoukkoon. Esimerkiksi //a
, poimii vain ne a
elementit, jolla on href
attribuutti ja sillä arvona apua.php
. Valinta ei kuitenkaan osu itse attribuuttiin vaan elementtiin, koska tarkentava askel on predikaatissa.
Predikaattien määrälle ei ole rajoituksia eikä niiden tarvitse sijaita polkulausekkeen lopussa. Niitä voi sijoittaa myös sisäkkäin. Predikaatin sisällä käytettävä mahdollinen polku alkaa elementistä, jolle predikaatti alun perin määriteltiin eikä se vaikuta predikaatin ulkopuolella olevaan kontekstiin.
Esimerkki: //a/@kohde
poimii kohde
attribuutin a
elementiltä edellyttäen että sillä on href
attribuuttina arvo apua.php
ja että a
elementti on div
elementin sisällä jolla puolestaan on luokka
attribuuttina arvo otsikko
.
XPath 1.0:ssa dokumentin rakenteet ovat olioita, jotka voidaan jakaa neljään eri tietotyyppiin: solmujoukko, merkkijono, numero sekä boolean-tyyppi.
Käytettävissä olevat operaattorit ovat:
/
, //
ja
operaattorit, joita käytetään polkulausekkeissa edellä kuvatulla tavalla.|
, joka muodostaa kahden solmujoukon yhdistelmän.and
ja or
+
, -
, *
, div
(jakolasku), ja mod
(jakojäännös)=
, !=
, <
, >
, <=
, >=
xml:lang
-attribuutilla merkittynä vastaa argumenttina annettua merkkijonoa.