Technik

Die Metadaten von Google Scholar werden automatisch erstellt und basieren auf Volltexterschliessung. Dabei werden weder vorhandene Metadaten der Informationsanbieter übernommen noch linguistische Verfahren angewendet. [10]

Der Index wird folglich ausschliesslich computerbasiert generiert. Jacsó [11] stellte bei seinen Analysen fest, dass dies nicht einwandfrei funktioniert. So enthält der Index "Geisterautoren" mit Namen wie D Definitions (für den Zwischentitel „Dictionary Definitions“) oder M View (für den Verlagsnamen „Mountain View“). Dass diese falschen Autoren zusätzlich aus den Originalquellen extrahiert werden, ist zwar ärgerlich (beispielsweise wenn man nach Beiträgen von Mary View-Schneider sucht), aber im Grunde relativ harmlos. Problematisch ist hingegen, wenn Geisterautoren anstelle der Namen der wirklichen Autoren indexiert werden. Ähnliche Fehler gibt es auch bei den Publikationsjahren. So werden teilweise Seitenzahlen oder Teile der ISSN als Erscheinungsjahr aufgeführt. [11]

Index

Ursprung der Metadaten

Google Scholar indexiert Webinhalte von Verlagen, Fachgesellschaften, Open-Access-Archiven und Zeitschriften, sowie Inhalte des freien Webs. Um welche Quellen es sich dabei konkret handelt, gibt der Betreiber nicht bekannt. [12]

Aktualität des Indexes

Der Betreiber macht keine Angaben zur Aktualität des Indexes. Untersuchungen haben jedoch gezeigt, dass der Index nicht tagesaktuell ist. [13]