Produsere‎ > ‎Finne informasjon‎ > ‎

Databaser


Hva handler denne artikkelen om:
  1. Databaser som strukturerte data
  2. Databaser kan presenteres på mange forskjellige måter
  3. Ulike feilkilder kan gi merkelige søkeresultater
  4. Alle data presenteres ikke for brukeren
  5. Det kan finnes flere veier til selve dataene
  6. De generelle søkemotorene kan få tak i noe av informasjonen i databaser
  7. Vi ser hvordan nettstedspesifikke søk kan fungere


Hva er en database

En database er kort forklart en måte å lagre data på, som sørger for at disse dataene er ordnet på en strukturert måte. Et regneark eller en tabell er slik sett en database, der kolonner representerer de datattypene som skal lagres og rader representerer hver instans.

Et enkelt eksempel vil være en tabell over navn og telefonnummer:


ID

Fornavn

Etternavn

Telefon

Adresse

1

Per

Olesen

5545789*

Hjemmeveien 1

2

Ole

Hansen

6789154*

Perrongveien 2

3

Anne

Persen

5681153*

Fraværgata 4

 


På web forholder vi oss til en mengde databaser. Alle store nettsteder lagrer informasjonen i databaser. Søker du i biblioteksbasen Bibsys er alle opplysningene om bøkene  lagret i en database. Google har en enorm database med informasjon om de fleste nettstedene på Internett, samt hvodan disse er koblet sammen.


Nå skal det sies at de store databaseløsninger er mye mer komplekse enn det lille tabelleksemplet ovenfor. I praksis vil en database bestå av en struktur av slike tabeller, som blir koblet sammen på svært komplekse måter, men i vår sammenheng er det av mindre betydning. Det som er viktig å vite er at en database stykker opp informasjonen, slik at det lettere kan lages nye forbindelser mellom de ulike delene og dataene kan behandles på forskjellige måter.


Et databasesystem har to deler – databasehåndteringssystemet (DBMS) som er programvaren som administrerer systemet, og selve databasen, som er de data som håndteres av systemet. DBMSen organiserer dataene og styrer all lesing og skriving til databasen. For å kommunisere med DBMSen brukes et spørrespråk.

Webgrensesnitt mot databaser

På web forholder ikke brukerne seg direkte til databasesystemet. I stedet blir det laget et grensesnitt som brukeren kan benytte for å sende spørringer til databasen. Vi skiller gjerne mellom fritekstsøk, der det søkes på tvers av alle tabellene i databasen.


I et tenkt tilfelle kan vi se for oss at vi gjør et fritekstsøk etter “Per” i den lille eksempelbasen vist ovenfor. Ulike systemer vil være satt opp til å håndtere dette på forskjellige måter, men vi kan se for oss at dette gir treff på fornavnet “Per” i linje 1, på etternavnet “Persen” i linje 3 og på Adressen “Perrongveien” i linje 2. Et slikt søk kan noen ganger fungere for et innledende grovsøk, men det er sjelden nyttig når vi skal gjøre finsøk.


Når vi snakker om søk i databaser tenker vi vanligvis ikke på de store søkemotorene, hvor vi som oftest benytter fritekstsøk. Det de fleste tenker på når de snakker om søk i databaser er strukturerte søk, som til en viss grad gjenspeiler hvordan dataene er lagret i databasen.

Søkegrensesnittet i biblioteksdatabasen Bibsys gir et inntrykk av hvordan dataene er ordnet:



https://ask.bibsys.no/ask2/html/.


Når du søker i fotodatabasen til Museum for universitets- og vitenskapshistorie, kommer det også fram hvilke emneord som ligger i databasen.



http://www.edd.uio.no/muv/fotosok.shtml


I brukerveiledningen til søket får du noen konkrete råd om hvordan du kan gå frem: Får du ingen treff når du søker i Avansert søk, så prøv samme søkeord i Enkelt søk. Kanskje du stavet du søkeordet feil, eller skrev det i feil felt? Dersom du ikke er sikker på stavemåteen, så skriv bare deler av ordet.


Får du for mange irrelevante treff, så se på teksten til de relevante treffene for tips til hvordan du kan spisse søket. I Avansert søk spisser du søket ved å fylle ut flere av feltene eller skrive flere ord i ett felt. Gjør dette primært hvis du får for mange treff når du søker med ett eller få ord.


I mange løsninger er det mulig å lagre søk i form av en URL. Dette har de utnyttet i eksemplet ovenfor og lagret noen ferdige søkeresultater. Selve linken ser temmelig kryptisk ut:


http://www.edd.uio.no/perl/search/newsearch.cgi?tabid=1987&appid=55&CustomPlan=1987_55&ResultatID=1624&listid=775591 - dette er imidlertid kun en teknisk sak, knyttet til hvordan akkurat denne løsningen kobler webgrensesnittet mot søk i databasen.


Slike komplekse linker trenger ikke brukerne forholde seg til, annet enn når de ønsker å videresende en bestemt link til en annen bruker.


Visuelle grensesnitt

Grensesnittet mot en database kan også lages mer visuelt. Et annet eksempel, fra Universitetsmuseene, demonsterer hvordan predefinerte søk er knyttet til et kart:



http://www.unimus.no/etnografi/khm/#/mapView


Størrelsem på punktene indikerer hvor mange treff i databasen som ligger bak de enkelte søkene. Klikker vi på ett av dem kommer vi til et mer ordinært grensesnitt:



http://www.unimus.no/etnografi/khm/#/listView?search=Island


Søket ovenfor er tydeligvis et fritekstsøk i databasen. V får ikke bare treff på landet “Island”, men også det engelske ordet “island” (øy). Dermed kommer et bilde av en sydhavsøy opp blant søketreffene. Dette er et ganske vanlig fenomen, som gjerne oppstår ved søk i databaser.

Her ser vi altså at selv om dataene ligger strukturert i databasen kan det oppstå merkelige treff, dersom vi ikke er nøye med hvordan vi søker. Ofte må vi bruke litt tid på å finne ut av en bestemt løsning fungerer.


Klikker vi på det lille bildet gjør vi et nytt, mer spesifikt søk i databasen:

 


http://www.unimus.no/etnografi/khm/#/detailsView?search=UEM4459


Vi kan linke til den aktuelle siden, men ikke direkte til selve bildet. Interessant nok er dette en teknisk løsning som mange museer og arkiver synes å foretrekke. Det betyr at vi heller ikke kan laste ned bildet, men må ta et skjermdump for å kunne lagre en kopi.



Castle island ved Killarney, Irland - Opphav ukjent - Kilde Unimus.no


Eksemplet gir oss flere muligheter til å vise et eksempel på hvordan det kan lages mange grensesnitt mot en database. På siden til detaljvisningen ligger det en link til en side med katalogtekster:



http://www.unimus.no/etnografi/khm/resources/etnomoreinfo.php?mnr=EM4459


Søkegrensesnittet på dette nettstedet er laget ved hjelp av Flash, en teknologi som begynner å bli gammeldags og som fungerer dårlig sammen med søkemotorer. Her er det imidlertid laget en annen, tekstbasert inngang, som vi finner ved å gjøre et søk på nettsidene med en generell søkemotor. Dette er slett ikke alltid tilfelle, men her kan vi bruke et nettstedspesifikt søk. 


Søk på ett nettsted

Et søk som er avgrenset til et bestemt nettsted har en søkestreng som begynner med “site:” og deretter adressen til nettstedet, i dette tilfellet “www.unimus.no” og søkeordet. Her søker vi etter referansen til bildet vi fikk treff på ovenfor “UEM4459”,

Søkestrengen i Google resulterer i dette treffet:



https://encrypted.google.com/search?hl=en&q=site%3Awww.unimus.no%20UEM4459

Vi får kun ett treff i søkemotoren, men dette linker til en side med svært mange oppslag. Her må vi gå over til en “lokal” søkestrategi der vi søker i det innholdet som vises på nettsiden. Vanligvis kan du gjøre dette ved å trykke CTRL+F på tastaturet. På denne måten finner vi fram til det aktuelle oppslaget, og finner en del ekstra opplysninger som ikke vises i de generelle søketreffene.





http://www.unimus.no/foto/html/KHM_foto_50000.html



I teksten som ledsager søketreffet finner vi en link til Universitet i Oslo, som eier kopien av dette bildet. Søker vi på katalogkoden år vi deminstrert en av databasenes baksider.:



http://www.khm.uio.no/?query=UEM4459&vrtx=search


De tre første søketreffene går til den samme siden. Noen ganger kan det være langt verre, og det grenereres en mengde søk, som alle leder til det samme materialet. Her finner vi en mindre versjon av bildet, som vi kan linke til.