In der Korpuslinguistik wird ein Satz gern zitiert: “You shall know a word by the company it keeps” (Firth, J. R. 1957: 11). Der semantische Gehalt eines Wortes wird durch das regelmäßig wiederkehrende Wortumfeld geprägt.
Der Firth’sche Satz begründet quantitative Techniken der Kollokations- bzw. Kookkurrenzanalyse. Anhand der Häufigkeit und statistischen Auffälligkeit von Worten im Umfeld eines Wortes, oder von Treffern für einen Suchbegriff werden Kollokationen bzw. Kookkurrenzen bestimmt.
Das polmineR-Paket nutzt den Begriff der Kookkurrenzen und beinhaltet eine
cooccurrences()
-Methode, weil dieser eher technische Begriff die zunächst bloss statistische Qualität des überzufällig häufigen Auftretens von Token im Umfeld eines Suchbegriffs besser ausdrückt. Der Begriff der “Kollokation” beinhaltet eine stärkere inhaltliche Aussage, die eine qualitative Analyse erfordert, die über die reine Textstatistik hinausgeht.Statistisch ermittelte Kookkurrenzen weisen auf sprachliche Muster hin, die Aufmerksamkeit verdienen. Der Übergang zu intersubjektiv absicherbaren Aussagen zu Deutungsmustern erfordert, dass an die quantitative Textanalyse von Kookkurrenzen eine qualitative Analyse von Konkordanzen (auch: Keyword-in-Context-Analyse, vgl.
kwic()
-Method) an die quantitative Analyse anschließt.