Literatuurzoeken

Appendix 1 bij PubMed en PsycINFO
Subject Search - achtergrond van zoeken op onderwerp


Inhoud Anatomie van databanken
MeSH Medical Subject Headings
Automatic Term Mapping

Anatomie van databanken
Databank Bestand met gestructureerde gegevens, bijv. een kaartenbak.
Bibliografische databank Bestand met gegevens van tijdschriften of boeken. Voor het zoeken en vinden van artikelen zijn de relevante gegevens (op zijn minst de auteurs, titel en brontijdschrift, vaak ook de samenvatting) in het bestand zijn opgenomen. De daar gevonden gegevens zijn voldoende om de artikelen zelf in de desbetreffende tijdschriften terug te vinden.
Bij een catalogus zijn alleen de titels van boeken en tijdschriften met de locatie (bij boeken ook de auteur) samen met de locatie in de bibliotheek opgenomen.
Records Databanken bevatten gestructureerde informatie. Records vormen de basis van deze structuur, te vergelijken met de kaarten in een kaartenbak. Op elke kaart staan de gegevens van één referentie, in bibliografische databanken betreft dit de gegevens van één tijdschriftartikel.
Velden Ook records zijn gestructureerd. Ieder record bevat een aantal velden met specifieke informatie: auteursveld, adresveld, titelveld, trefwoordenveld, tijdschriftveld, abstractveld. Velden kunnen afwezig zijn; zo heeft een record dat verwijst naar een kort artikel, zoals een letter-to-the-editor of een comment, meestal geen samenvatting.
Indexen In elke bibliografische databank zijn er altijd op zijn minst drie voor gebruikers toegankelijke alfabetische indexen (woordenlijsten) beschikbaar om in te zoeken: de auteursindex, de titelwoordenindex en de index met tijdschriftnamen. Vaak is er ook een alfabetische of functionele woordenlijst met trefwoorden.
Trefwoorden In verscheidene databanken bevat elke record een of meer velden met trefwoorden. Deze trefwoorden zijn aan de referenties toegevoegd om het terugvinden van de record in de grote berg informatie specifieker te maken.

Er zijn verschillende soorten trefwoorden. Bij de ene databank gaat het om woorden die de auteur zelf bij zijn artikel heeft vermeld (author keywords), bij de andere databank staan in het trefwoordenveld synoniemen en alternatieve termen, zo mogelijk enigszins gestandaardiseerd.

Thesaurus Trefwoorden kunnen afkomstig zijn uit één systeem van echte gestandaardiseerde trefwoorden (controlled terms, subject headings). Zo'n systeem wordt thesaurus genoemd. Deze trefwoorden zijn nauwkeurig omschreven; indexeerders zijn bij het toevoegen van trefwoorden aan referenties aan strikte regels gebonden.
Functionele boomstructuur (Tree) De trefwoorden uit een thesaurus kunnen in een functioneel verband tot elkaar staan: de hierarchical tree. Bij elektronische bestanden die zo zijn opgebouwd is het bijvoorbeeld mogelijk artikelen te vinden door de trefwoorden die bij elkaar in één boomtak staan ook in één zoekactie te gebruiken: explode.
Soorten zoekacties Op basis van de structuur van bibliografische databanken zijn er meer soorten zoekacties te onderscheiden:

subject search:
zoeken op onderwerp, d.w.z. met gebruikmaking van subject headings uit het trefwoordensysteem en de extra mogelijkheden die dit systeem biedt; hierbij wordt altijd gezocht in het trefwoordenveld;

free textword search:
zoekacties met vrije zoekwoorden die moeten vóórkomen in de 'platte' tekst van de records (in de woorden die op de kaart staan); dit kan beperkt worden tot één veld, maar vaak ook kan worden gezocht in meer velden tegelijk;

index search:
zoeken door woorden te selecteren uit een alfabetische lijst van voorkomende woorden; dat kan per veld, maar vaak ook voor meer velden tegelijk;

limit search:
staat een beetje buiten dit schema; hiermee wordt bedoeld: inperken op standaardbegrippen als taal, leeftijdscategorie, publicatietype.


Subject Headings
- Medline: Medical Subject Headings
- PsycINFO: Psychological Index Terms

De Amerikaanse National Library of Medicine (NLM) heeft bij de productie van Medline aan ALLE referenties een extra veld met ± 20 trefwoorden (MeSH-termen) toegevoegd. De trefwoorden zijn afkomstig uit een systeem met nauwkeurig gedefinieerde begrippen. De indexeerders die de MeSH-termen toekennen moeten zich hierbij aan stricte voorschriften houden.  Het systeem bij PsycINFO is vrijwel identiek.

Niet alle records in Medline zijn voorzien van een veld MeSH-termen. In de Summary-weergave staat één van de volgende aanvullende opmerkingen:
- "[PubMed - as supplied by publisher]": deze records zijn door de uitgevers zelf aan PubMed toegevoegd op het moment dat de inhoud van de te publiceren tijdschriften bekend was; bevatten geen trefwoorden;
- "[PubMed - in process]": deze records zijn in bewerking bij NLM worden en zijn na enkele maanden van trefwoorden voorzien;
- "[PubMed]": aanvullende records die niet in Medline voor komen; krijgen nooit trefwoorden;
- "[PubMed - indexed for MEDLINE]": deze records zijn van trefwoorden voorzien;
- "[PubMed - OLDMEDLINE]": records uit de voorloper van Medline; bevatten trefwoorden uit zowel het 'oude' als het 'nieuwe' systeem.

 

Er zijn verschillende aspecten aan deze trefwoordsystemen te herkennen (zie de volgende figuur uit PubMed):

 

 

Subject Headings geven de onderwerpen aan, bijv. betreffende allerlei met name genoemde ziekten, chemische stoffen, technieken,
bijv. Enzyme Inhibitors, bijv. Neoplasms
Tree de onderwerpen zijn gerangschikt in vele hiërarchische  boomstructuren, bijv. de tree met alle ziekten, met vele subtrees, bijv. alle tumoren; de tree met alle chemische stoffen, waaronder weer alle chemotherapeutica

Voorbeeld van een deel van de MeSH-tree rondom 'vegetables':

Explode bij het zoeken via de tree is het mogelijk een 'explosie' van boomtakken te maken, daarbij wordt dan niet alleen de desbetreffende boomtak gezocht, bijv. Neoplasms, maar ook alle takken op lagere niveaus; in PubMed wordt automatisch deze Explode gemaakt
Subheadings
(niet bij PsycINFO)
onderkopjes bij de onderwerpen, bijv. bij ziekten horen subheadings over diagnose, therapie, epidemiologie; bij chemische stoffen behoren schadelijke bijwerken, diagnostisch of therapeutisch gebruik, toediening en dosering. Er bestaat ook een explode in de Subheading-tree die bij PubMed automatisch wordt toegepast (zie Appendix2: Subheadings),
bijv. prevention & control in Neoplasms/prevention & control
Major Topics de combinatie van Subject Headings/subheading is gebruikt als hoofdtrefwoord en geeft aan waarover het desbetreffende artikel gaat; dit is te herkennen aan een sterretje (*) bij de combinatie,
bijv. Diet*, bijv. Neoplasms/prevention & control*
Bij het zoeken worden automatisch alleen op Major Topics gezocht als het selectievakje [Restrict Search to Major Topic headings only] wordt aangevinkt
Minor Topics de combinatie van Subject Heading/subheading is gebruikt als bijtrefwoord, het geeft aan wat in het desbetreffende artikel ter sprake komt,
bijv.
Brassica/therapeutic use, bijv. Human
Entry Terms geldige alternatieve termen die bij het zoeken kunnen worden gebruikt, bijv. red blood cell is een geldig alternatief en wordt automatisch vervangen door erythrocytes; PubMed kent bovendien een extra systeem met termen die een geldig alternatief zijn voor MeSH-termen: UMLS (Unified Medical Language System)
Automatic Term Mapping is een systeem waarmee PubMed probeert opgegeven zoekwoorden te koppelen aan MeSH-termen
Voordelen:
  • u behoeft zich geen zorgen te maken om alle mogelijke synoniemen die een auteur kan hebben gebruikt, altijd hangt er (in theorie) hetzelfde trefwoord aan, bijv. aan artikelen over lung cancer of pulmonary neoplasm hangt het trefwoord Lung Neoplasms
  • Explode Search: u kunt automatisch alle smallere takken van een brede tak meenemen, bijv. alle Digestive System Neoplasms
  • in Medline kunt u met subheadings gelijk aangeven wat u wilt weten over het onderwerp, bijv. epidemiology , bijv. adverse effects
  • PubMed helpt u de trefwoorden te vinden.
Nadelen:
  • het kan discutable zijn hoe de indexeerders de trefwoorden hebben toegewezen aan de referenties (ondanks alle richtlijnen)
  • soms is het onduidelijk welke termen nodig zijn, bijv. gaat het om de bacterie die de infectie veroorzaakt, of om de infectie die door die bacterie wordt veroorzaakt
  • voor de nieuwste termen in een vakgebied moeten nog termen worden vastgesteld
  • voor zeer gedetailleerde begrippen zijn er vaak geen MeSH-termen, die worden ondergebracht bij een bredere term, bijv. artikelen over broccoli of kool (cabbage) krijgen het bredere begrip brassica als trefwoord toegewezen, waarbij broccoli en cabbage wel als cross-references bekend zijn; zoeken op broccoli levert automatisch alle artikelen over brassica e.d., ook als dat niet de bedoeling is
  • het is vaak wat ondoorzichtig hoe PubMed MeSH-termen koppelt aan uw zoekwoorden, dat kan leiden tot onverwachte resultaten.

Advies

  1. Kijk altijd naar de resultaten: geven die antwoord op uw vraag?
  2. Indien nodig: probeer ook andere trefwoorden te vinden.
  3. Vul eventueel aan met zoekacties in de tekst.

Automatic Term Mapping

1. Het PubMed-zoekprogramma probeert automatisch opgegeven zoekwoorden te interpreteren:
  1. als MeSH-trefwoord (door vergelijking met een lijst toegestane alternatieven: UMLS = Unified Medical Language System)
  2. als naam van een auteur (bijv. van rood jj), maar dat is beter op te geven in het auteursveld
  3. als tijdschrifttitel (bijv. ned tijdschr geneeskd), maar dat is beter op te geven in het veld 'journal name'
  4. als phrase (speciale lijst met dubbelwoorden, bijv. colon cancer)
  5. indien niet gevonden: PubMed verdeelt een reeks zoekwoorden in groepen of losse woorden met AND ertussen en probeert de nieuwe eenheden opnieuw te interpreteren.
2. Als PubMed zoekwoorden herkent als (alternatief van) een MeSH-term gebeurt het volgende:
  • PubMed maakt een explode: zoekt alle records die als trefwoord deze MeSH-term of een MeSH-term uit een smallere tak van de MeSH-tree bevatten
  • PubMed zoekt alle records die de oorspronkelijke zoekwoorden bevatten in de titel, samenvatting, trefwoorden, en enkele andere velden
  • sinds enige tijd zoekt PubMed ook alle phrases in zoekwoorden en MeSH in AND-combinatie; aangezien de losse woorden niet naast elkaar in hetzelfde veld behoeven te staan (bijv. het ene woord in de titel en het andere woord in de samenvatting) kan dit aanleiding zijn voor vele extra records die niet relevant zijn.
  • PubMed zet alle gevonden records in OR-combinatie
    bijv. colon cancer wordt gezocht als colonic neoplasms[mesh] OR (colonic[all fields] AND neoplasms[all fields]) OR colonic neoplasms[all fields] OR (colon[all fields] AND cancer[all fields]) OR colon cancer[all fields]
  • 3. Voorwaarden voor Automatic Term Mapping:
    • gehele woorden (dus GEEN woordstam met wildcard)
    • phrase niet tussen "aanhalingstekens" (tenzij exact als MeSH-term, maar niet noodzakelijk)
    • zoek in alle velden of specifiek in het veld met de MeSH-termen
    • zoek direct of via preview, maar niet via indexen
    ADVIEZEN:
    • begin met gebruikelijke zoekwoorden
    • zet in een phrase geen AND (colon AND cancer); laat PubMed het maar uitzoeken
      (zet je operators tussen zoekwoorden dan zullen de zoekwoorden Automatic Term Mapping ondergaan als losse eenheden)
    • controleer met [Details]; levert de zoekactie te weinig op: probeer een synoniem
    • maak een OR-combinatie van volledige termen en afgebroken woorden met wildcard
      bijv. breech presentation OR breech present*

    begin


    © Medische Bibliotheek Erasmus MC
    08-12-2009 MB-CBI