Att söka på begrepp och använda närhetsoperatorer i databaser

Bland de databaser som används mest på KI finns både databaser med kontrollerad vokabulär (till exempel Pubmed och Cinahl) och databaser som använder sig av fritextsökning (till exempel Web of Science). Det är ganska stora skillnader mellan dessa två typer av databaser, vad gäller hur man bäst söker.

Pubmed använder en kontrollerad vokabulär som heter MeSH. När man söker på en term i Pubmed mappas den automatiskt till korrekt MeSH-term (om det finns någon). Du behöver alltså inte veta vilken term som är den korrekta, Pubmed ordnar det åt dig.

Ta för vana att alltid kontrollera Search Details, för att se vad databasen gjort på baksidan:

Om du söker på en fras eller ett begrepp, kan det vara lockande att sätta dina söktermer inom citationstecken, för att visa att du vill söka på det som ett begrepp som t.ex. ”egg allergy”. Men det bör du inte göra i databaser som använder sig av en kontrollerad vokabulär. Om du gör det, fungerar inte den automatiska mappningen i PubMed, som mappar egg allergy till egg hypersensitivity[MeSH Terms].

Hur funkar det då i en databas som inte har en kontrollerad vokabulär, och om den term du vill söka på består av två (eller flera) ord?

I en fritextdatabas funkar det utmärkt att söka på begreppet som en fras med citationstecken: ”egg allergy”. Det här är bra att göra när ett av orden är ett vanligt förekommande ord som disease, attack, allergy osv. Söker du på ett begrepp som heart attack gör det stor skillnad, i både relevans och antal träffar, om du använder citationstecken eller inte:

heart attack ger 24 030 träffar
(Ambulatory heart rate changes in patients with panic attacks)

”heart attack” ger 5 148 träffar
(Preventing heart attack and death in patients with coronary disease)

Däremot gör det ingen större skillnad, varken i relevans eller antal träffar, att söka på ett specifikt begrepp som ”rheumatoid arthritis” med citationstecken, jämfört med utan citationstecken:

rheumatoid arthritis ger 134,998 träffar
”rheumatoid arthritis” ger 133,686 träffar

Söker du på två begrepp i en databas som Pubmed, Web of Science eller Google sätter databasen automatiskt in den booleska operatorn AND mellan begreppen. Då hittar databasen dessa två termer någonstans i abstraktet eller titeln:

Det finns en tredje variant också om man inte kräver att orden ska stå exakt efter varandra (”egg allergy”) men det inte heller är tillräckligt att båda orden återfinns någonstans i abstraktet eller titeln (egg AND allergy). Då kan du använda så kallade närhetsoperatorer, som i databaserna brukar kallas proximity operators. Då begär du att databasen ska hitta orden du söker på i närheten av varandra, men de behöver inte stå exakt bredvid varandra, som i en fras. Närhetsoperatorer uttrycks på lite olika sätt i olika databaser:

NEAR i Web of Science och adj i Medline (OVID).

Du kan också bestämma hur många ord du ”tillåter” mellan dina två termer. Då skriver du:

egg NEAR/2 allergy respektive egg adj2 allergy.

Det betyder att du återfinner dessa båda termer med maximalt två ord emellan. En sökning på ”egg allergy” fångar inte egg and milk allergy, vilket däremot egg NEAR/2 allergy gör.

För att se vilken närhetsoperator som gäller i vilken databas, måste du titta i hjälptexterna. Viktigt att notera är också att närhetsoperatorer inte fungerar i Pubmed.

Susanne Gustafsson

Bibliotekarie på KIB som träffar många av våra studenter och doktorander, både i undervisning och i KIB-labb; en akademisk verkstad på Universitetsbiblioteket.