Hitta hit:
T-bana: Universitetet
Frescativägen 40

Ordinarie öppettider:
Tisdag-söndag 10-18


  • Huvudmeny

Introduktion till databaser

1. Om databaser


En förenklad definition är att en databas är en samling information (data) om till exempel litteratur, organiserad så att det går lätt att söka efter enskilda upplysningar.

Nedanstående är en kortfattad presentation av grundläggande databasbegrepp rörande främst bibliografiska databaser och elektroniska tidskrifter (fulltextdatabaser). Detaljer om de enskilda databaserna finns i separata presentationer som du bör läsa innan du använder dem.

1.1 Olika sorters databaser


De databaser som finns på Naturhistoriska riksmuseets biblioteks hemsida är dels egentliga bibliografiska databaser och dels fulltextdatabaser. Därtill kommer Digitala kartbiblioteket samt Encyclopedia of life support systems (EOLSS). Fulltextdatabaser är webbplatser för elektroniska tidskrifter, som i regel har inbyggda databaser för att hjälpa läsaren hitta bland materialet. De bibliografiska databaserna har å sin sida numera ofta länkar till artiklar i resultatlistan, om texten finns tillgänglig online.

1.2 Databasernas uppbyggnad


Informationen i en databas är ordnad i poster, så att t.ex. varje artikel eller bok i en databas har en post. Posterna är indelade i fält, så att det till exempel finns ett författarfält, ett titelfält och ett fält med ämnesord. Ofta finns dessutom ett fält med abstract. I e-tidskrifternas databaser går det dessutom att söka i själva artikeltexten.

Ämnesorden i databasen är i regel av två slag: dels sådana som tilldelats en artikel av upphovsmännen själva, och dels sådana som databasen tilldelat artikeln. De senare kommer i regel från en officiell ordlista, en tesaurus. I många databaser kan man gå in i tesaurusen och välja ut de ämnesord man vill söka på.

Utöver tesaurusen samlas termer i databasen i olika index. Det finns ett index för författarnamn, ett index för ord i titeln etc. I vissa databaser kan man gå in i index och välja ut de termer man vill söka på.

2. Sökning


Ofta har databasen sökformulär av olika svårighetsgrad, med en enkel sökruta på startsidan, och länkar till mer avancerade sökformulär i olika steg. I de mer avancerade finns det flera sökfält där man kan söka i olika fält samtidigt, och kombinera termer med så kallad boolesk logik (se nedan). Om du har en allmän sökfråga, som exempelvis litteratur om ett visst ämne, kan du använda den enkla sökrutan. Om du är ute efter något mer specifikt är det ofta enklare att använda avancerade formuläret. Det går i regel att göra liknande sökningar i de enklare formulären, men då måste man själv skriva in booleska operatorer (se nedan), fältkoder etc.

2.1 Söklogik


De flesta databaser använder sig av boolesk logik i sökfälten. Boolesk logik bygger på tre operatorer (som brukar återges på engelska med stora bokstäver): AND, OR och NOT. Om du söker på två ord (söktermer) förenade av AND, så vill du ha poster där bägge termerna förekommer. Om du istället söker med OR räcker det om en av termerna förekommer i posten. NOT betyder att du är intresserad av poster som innehåller den första termen, men bara om inte den andra termen är med. De flesta databaser (men inte alla) underförstår ett AND om du skriver in flera termer i samma fält. Det går också att kombinera söktermer och operatorer till mer komplicerade sökningar med hjälp av parenteser.

Du kan i regel också använda frassökning, där du i stället för att söka på enstaka ord söker på en hel fras. Det vanligaste är att det sker genom att frasen sätts inom citationstecken. En sökning på frasen "orthoceratiter från gotland" ger som resultat poster som innehåller exakt den frasen, medan en sökning på orthoceratiter från gotland i de flesta databaser motsvarar en sökning på orthoceratiter AND gotland, eftersom söksystemet hoppar över att söka på vanliga ord som från (så kallade stoppord), och AND är underförstått. En sådan fras kan kombineras med andra fraser eller enstaka termer med hjälp av booleska operatorer.

Det går oftast också att trunkera söktermerna för att få fler poster i resultatet. Trunkering innebär att man byter ut ett eller flera tecken mot ett jokertecken (wildcard), som kan stå för vilket tecken som helst. Reglerna för trunkering varierar kraftigt mellan olika databaser, men det vanligaste är att asterisk (*) fungerar som jokertecken. Det vanligaste är att man trunkerar i slutet av ord (högertrunkering; en sökning på minera* ger som resultat poster om mineral, mineraler, mineralogi etc.), men ibland går det även att trunkera i början av ord eller inuti ord (en sökning på wom*n ger resultat med både woman och women). Vissa databaser har automatisk högertrunkering, där en sökning på mineral automatiskt ger även mineraler och mineralogi bland svaren. Trunkering är ett mycket användbart medel för att få med olika former och avledningar av ord i sökningen, men eftersom det inte finns någon klar standard bör du se efter hur det fungerar i varje enskild databas.

Vissa databaser använder också närhetsoperatorer, där man till exempel kan ange hur långt ifrån varandra två söktermer skall vara. Det kan vara användbart till exempel om man vill försäkra sig om att två ord förekommer i samma sammanhang i texten.

Det spelar i regel ingen roll om man skriver med stora eller små bokstäver i sökningarna (ibland med undantag för booleska operatorer, se ovan).

I de flesta databaser går det att kombinera flera sökningar med booleska operatorer.

2.2 Registrerad användare


De flesta databaser erbjuder också möjlighet att bli registrerad användare. En registrerad användare kan logga in till sina egna sidor på databasen och spara sina tidigare sökningar för att göra om dem vid ett senare tillfälle, eller beställa påminnelser (alerts). Sådana alerts kan till exempel meddela när nya poster som motsvarar sökfrågan läggs in i systemet, eller när en artikel kommer som citerar en viss annan. Alerts kan vara antingen via e-post eller som rss-flöden.

De flesta databaser erbjuder numera också möjlighet att exportera resultatet av sökningen till ett referenshanteringsprogram (citation manager).

3. Fulltextdatabaser (e-tidskrifter)


Webbplatser med e-tidskrifter kan grovt delas in i två grupper: de som kräver prenumeration och de som är open access. Open access innebär att innehållet är fritt tillgängligt via Internet. Flera av Naturhistoriska riksmuseets open access-länkar går till portaler för tidskrifter från hela världen, vilket betyder att gränssnittet inte är lika enhetligt som hos de webbplatser som hör hemma hos de stora förlagen.

De databaser som ingår i e-tidskrifterna är uppbyggda på samma sätt som vanliga bibliografiska databaser, om än i regel något enklare. Det går också att browsa, eller bläddra, sig fram (engelska "browse") bland årgångar och nummer av tidskrifterna (som oftast finns under rubriken Archives). Ofta är det skillnad mellan äldre och nyare online-årgångar av tryckta tidskrifter. De nyare är inlagda direkt på webben, medan de äldre har scannats in i efterhand ("backfiles") och har inte lika många åtkomstmöjligheter. Ofta måste man dessutom prenumerera separat på de äldre årgångarna.

Själva texterna presenteras i regel i såväl pdf- som html-format. Pdf visar artikeln som den ser ut i tryck, och är oftast det bästa alternativet om du vill skriva ut artikeln. I html-versionerna är i regel noterna länkade.