OR is moore! Enligt George Boole i alla fall

Ni som deltagit i vår undervisning eller pratat sökningar med en bibliotekarie kanske har hört termen ”booleska operatorer”, namngivna efter matematikern och filosofen George Boole? För er som inte riktigt hängde med och för er andra kommer här en förklaring av vad de är och hur man använder sig av dem.

I söksammanhang används de booleska operatorerna för att berätta för databasen hur termerna man skrivit in ska kombineras – det finns en logisk användning av begreppet också, men den bortser vi från här. Med hjälp av de booleska operatorerna anger du om alla termerna du skrivit in måste finnas med i ett dokument, om det räcker med någon av dem finns med eller om det rent av är så att någon av termerna inte får finnas med. De tre operatorerna det handlar om är här AND, OR och NOT.

Det luriga med de booleska operatorerna är att de inte alltid fungerar likadant som samma ord i vardagsspråket. Om du går till affären och köper äpplen OCH päron så kommer du hem med mer än om du köper bara äpplen. Om du istället söker i en databas så ger äpplen OCH päron färre träffar än bara äpplen. Lägger du till ytterligare en term kommer du att få ännu färre träffar. AND (OCH) som boolesk operator innebär att du söker efter dokument som innehåller båda termerna, och begränsar alltså sökningen.

När du söker i databaser kommer AND troligen att vara den booleska operator som du använder dig av allra mest. Ofta är du intresserad av två eller flera ämnen i kombination, och du skriver då in termerna med ett AND emellan: stroke AND depression

Om man inte anger hur man vill kombinera sina söktermer så kommer många databaser att försöka tolka frågan ändå. Vanligast är att databasen tolkar din fråga just som att termerna är kombinerade med AND. Så är det till exempel i Pubmed och så är det när du söker i Google. Stroke depression kommer alltså att ge samma resultat som stroke AND depression.

Om du istället vill bredda din sökning till dokument som innehåller någon av termerna ska du kombinera dem med OR. För varje term du lägger till kombinerat med OR får du fler träffar. OR is moore! Här finns faktiskt också en skillnad jämfört med vardagsspråket, även om den här skillnaden verkar orsaka mindre problem. I vardagsspråket innebär ofta ELLER endast ett av alternativen, och inte båda samtidigt. Om du får frågan: ”Vill du ha kaffe eller te?” förväntas du nöja dig med det ena. I söksammanhang innebär OR (ELLER) det ena eller det andra, eller bådadera.

När ska man använda OR? Synonymer bör kombineras med OR emellan. Eftersom olika författare kan ha använt olika termer för en och samma företeelse behöver man göra en sökning som täcker in dokument där någon av termerna använts. Cancer kan till exempel också benämnas neoplasms och tumors. Sökningen cancer OR neoplasms OR tumors fångar upp dessa tre varianter.

I databaser med en kontrollerad vokabulär har man bestämt vilken av termerna som ska användas för ett ämne, och indexerat, eller taggat alla dokument med just den. Därför behöver du när du söker i en sådan databas inte tänka på att täcka in olika synonymer. Vi har tidigare skrivit om detta i inlägget Databaser bakom kulisserna. Ta för vana att kolla om det finns en kontrollerad vokabulär när du ska söka i en ny databas, eftersom det påverkar hur du bör utforma din sökning.

Det finns förstås fall när det är användbart att kombinera termer i OR även i en databas som har en kontrollerad vokabulär. Om du är intresserad av sambandet mellan munhålecancer och olika former av tobaksanvändning, som rökning och snus, skulle en sökning kunna se ut så här, med MeSH-termer: Mouth Neoplasms AND (smoking OR Tobacco, Smokeless). Parentesen talar om för databasen hur sökningen ska tolkas.

Den tredje booleska operator som går att använda i de flesta databaser är NOT. Den begränsar sökningen genom att den utesluter dokument som innehåller en viss term. Var dock försiktig med NOT eftersom du riskerar att också utesluta relevant material. Kanske nämns den term du utesluter bara i förbigående, eller så skriver författarna till och med att de inte studerat den aktuella företeelsen. Databasen tar inte hänsyn till sammanhanget där termen förekommer.

Behöver du hjälp med att kombinera dina termer på bästa sätt? Kom till biblioteket så hjälper vi dig gärna.

Detta blogginlägg publicerades ursprungligen på bibliotekets gamla blogg i april 2013.

Magdalena Svanberg (tjl.)

Bibliotekarie som handleder och undervisar studenter på alla nivåer. Är också del av bibliotekets sökargrupp.