Bei der Analyse von Korpora ist regelmäßig die synchrone Variation von Sprache (als Trägerin von Bedeutungen, Deutungsmustern etc.) von Interesse oder der (diachrone) Wandel im Zeitverlauf. Dementsprechend ist die Erstellung von Subkorpora zentral für den sinnvollen Einsatz von Korpora im Forschungsprozess.
In der Terminologie des polmineR-Pakets wird an Stelle von “Subkorpus” (subcorpus) der Begriff der “Partition” (partition) verwendet. Dies ist zum einen in der französischen lexikometrischen Forschung üblich. Vor allem aber kann partition sowohl als Verb als auch als Nomen auftreten: In der Programmierung gilt es als gute Praxis, wenn für Methoden Verben verwendet werden. Die
partition()
-Methode partitioniert ein Korpus und erzeugt ein Objekt der Klassepartition
, welches die relevanten Informationen zur Beschreibung einer Partition enthält.Die Erzeugung einer Partition erfolgt anhand von S-Attributen (strukturellen Attributen). Diese Attribute können als Metadaten auf der Textebene angesiedelt sein. Weil sie aber sehr flexibel Text-Regionen auszeichnen können, können S-Attribute etwa auch Annotationen von Textpassagen unterhalb der Textebene sein.
Welche S-Attribute in einem Korpus vorhanden sind und welche Werte diese annehmen, lässt sich mit der
s_attributes
-Methode ermitteln. (Siehe hierzu der vorangegangene Foliensatz zu Korpora.)