Databaser bakom kulisserna

Vad är det man gör när man söker i en databas? I de flesta fall försöker man ta reda på vad som finns skrivet om ett visst ämne. Det man hittar är väl det som finns? Och om man inte hittar någonting, så finns det inget, eller?

Tyvärr är det inte så enkelt. Du söker i en databas för att ta reda på om det finns något skrivet om ett visst ämne, men vad databasens sökfunktion i själva verket svarar på är om de termer som du skrivit in finns med i den information som finns i databasen.

De allra flesta databaser innehåller inte fulltexterna, det vill säga hela artiklarna, utan bara information om artiklarna, som titel, abstrakt och nyckelord. Informationen brukar kallas referenser eller metadata. Om en artikel visserligen handlar om ett ämne, men detta ämne inte avspeglas i titel, abstrakt eller nyckelord blir det svårt att hitta artikeln. Här skiljer sig databaserna från Google och Google Scholar, där sökningen sker i fulltexten. Om du är intresserad av ämnen som det är svårt att hitta artiklar om är det därför en bra idé att prova Google Scholar, eller vårt discoveryverktyg reSEARCH, som också innehåller en del fulltexter, för mer uttömmande sökningar.

När du söker i en databas är du begränsad till de ord som förekommer i referenserna. Ett och samma ämne kan uttryckas på olika sätt, med olika synonymer eller närliggande begrepp. Om du söker efter ämnet cancer genom att skriva in detta ord i en databas, så hittar du referenser som innehåller just detta ord. Referenser där cancer uttryckts på ett annat sätt, till exempel som neoplasms, tumors, oncology kommer inte att dyka upp i resultatlistan.

Läget verkar minst sagt dystert, går det över huvud taget att hitta artiklar om ett visst ämne?

Ja, tack vare de kontrollerade vokabulärerna i många databaser går det faktiskt ändå rätt så bra. I en kontrollerad vokabulär har man bestämt vilken term som ska användas för ett visst ämne, och indexerat, eller taggat, alla dokument med just den. I Pubmed heter den kontrollerade vokabulären MeSH, Medical Subject Headings. Oavsett hur författaren utryckt sig så kommer artiklar om cancer i Pubmed att förses med MeSH-term Neoplasms. Därför behöver du när du söker med hjälp av MeSH-termer i Pubmed inte tänka på att täcka in olika synonymer.

Omvänt så kommer inte en artikel där en företeelse bara nämns i abstraktet att förses med MeSH-termen för den företeelsen. Företeelsen ska verkligen vara ämnet för artikeln för att MeSH-termen ska användas. Om du till exempel är intresserad av artiklar om BMI så kan du med hjälp av MeSH-termen Body Mass Index begränsa dig till de artiklar där BMI är ämnet, och undvika artiklar om andra ämnen där information om patientgruppens genomsnittliga BMI beskrivs i abstraktet.

Hur vet man vilken term som används för en viss företeelse? Du kan använda Svensk MeSH eller MeSH Database som är tillgänglig via Pubmed för att se vilka MesH-termer som finns och hur de förhåller sig till varandra. Men faktum är att du kommer att ha nytta av MeSH-termerna även om du struntar i att kolla upp vilken term som gäller. Det finns en funktion i Pubmed som försöker mappa eller översätta de termer du skriver in till de korrekta MeSH-termerna. Skriver du in cancer så kommer en sökning att ske även på MeSH-termen Neoplasms. Du kan se hur Pubmed mappat dina termer till MeSH-termer i rutan Search Details.

Andra exempel på databaser med kontrollerade vokabulärer är Cinahl, Embase och Psycinfo. Även här finns mappningsfunktioner som hjälper till att översätta de ord du skriver in till de korrekta termerna. Ibland är det förvalt att mappningsfunktionen är påslagen, ibland behöver man aktivt slå på den. Ett bra tips är att låta databasen hjälpa till, och ha funktionen påslagen.

Även i databaser utan kontrollerade vokabulärer finns det söktekniker som kan överbrygga begräsningarna som databasernas uppbyggnad medför.

Magdalena Svanberg (tjl)

Bibliotekarie som handleder och undervisar studenter på alla nivåer. Är också del av bibliotekets sökargrupp.