Räcker Google Scholar hela vägen?

Vi rekommenderar ofta forskare och studenter att söka litteratur i flera olika databaser eftersom ingen är heltäckande, en rekommendation som också stödjs av många olika studier 1-3. Google Scholar har som ambition att inkludera all vetenskaplig litteratur även om den exakta täckningen är oklar. Kan Google Scholar ersätta sökningar i flera databaser?

Gehanno et al. försöker besvara denna fråga i sin artikel “Is the coverage of Google Scholar enough to be used alone for systematic review” 4. Gehanno et al. utgår i sin studie från 29 systematiska översikter, fjorton hämtade från Cochrane Library och de övriga femton publicerade i JAMA. Sammanlagt ingick 738 studier i dessa översikter, och dessa användes för att mäta recall hos Google Scholar.

Recall är ett mått för hur stor andel av de relevanta träffarna som en viss sökning eller en viss databas fångar in. Recall brukar anges i procent, vid 50 % recall återfinns hälften av de relevanta artiklarna. Ofta undersöks också precisionen hos sökningen. Precisionen är ett mått för förhållandet mellan relevanta och irrelevanta artiklar i sökresultatet. Vid 50 % precision är hälften av de träffar man fått relevanta.

Författarna återfann samtliga 738 studier i Google Scholar, en recall på häpnadsväckande 100 %.

Är det dags att skrota rekommendationen om att använda flera olika databaser för att åstadkomma uttömmande litteratursökningar? Ja, Gehanno et al. drar den slutsatsen, det behövs bara vissa förbättringar av precisionen och sökfunktionerna hos Google Scholar.

Hur var det med precisionen då, det andra måttet? Precision ingick inte i den huvudsakliga undersökningen, men författarna gjorde några stickprov. För de två sökfrågor de redovisar var precisionen ca 0,1 %. Den ena frågan gav 36 630 träffar, varav 36 ingick i den systematiska översikten. Den andra frågan gav 16 100 träffar, varav 14 ingick. Frågan är hur intressant 100 % recall är med denna väldigt låga precision? Vem vill eller har möjlighet att bläddra igenom 36 630 träffar för att hitta 36 relevanta artiklar? Jag tror att databaser med bättre precision än så länge har en tydlig roll att spela.

Men Google Scholar har förstås också en roll. För snäva ämnen med specifika sökfrågor kommer den låga precisionen inte att vara ett så stort problem. Sökning i fulltexterna gör att det går att hitta sådant som är dolt under ytan i andra databaser, där sökningen görs bara i abstrakt och titel.

Jag gissar att vi kommer att fortsätta att rekommendera er att söka i flera databaser ett bra tag framöver. Det är inte bara för att ni riskerar att missa relevanta artiklar som ni ska söka i flera databaser, utan också för att de specialiserade databaserna har sökfunktioner som gör mer fokuserade och mer sofistikerade sökningar möjliga. Högre precision, helt enkelt!

  1. Golder S, Loke YK. The contribution of different information sources for adverse effects data. Int J Technol Assess Health Care. 2012 Apr;28(2):133-7.
  2. Michaleff ZA, Costa LO, Moseley AM, Maher CG, Elkins MR, Herbert RD, Sherrington C. CENTRAL, PEDro, PubMed, and EMBASE are the most comprehensive databases indexing randomized controlled trials of physical therapy interventions. Phys Ther. 2011 Feb;91(2):190-7.
  3. Bahaadinbeigy K, Yogesan K, Wootton R. MEDLINE versus EMBASE and CINAHL for telemedicine searches. Telemed J E Health. 2010 Oct;16(8):916-9.
  4. Gehanno J-F., Laetitia R., Darmoni, S. Is the coverage of Google Scholar enough to be used alone for systematic reviews. BMC Med Inform Decis Mak. 2013 Jan 9;13:7.

Magdalena Svanberg

Bibliotekarie som handleder och undervisar studenter på alla nivåer. Är också del av bibliotekets sökargrupp.