- Als Platzhalter für beliebige Worte dienen leere eckige Klammern:
count("GERMAPARL", query = '"(Bundesm|M)inisterium" [] [pos = "NN"]', cqp = T, breakdown = T) %>%
head(n = 3) %>% subset(select = c("match", "count", "share"))
## match count share
## 1: Bundesministerium der Justiz 421 8.40
## 2: Bundesministerium für Arbeit 410 8.18
## 3: Bundesministerium der Finanzen 354 7.06
- Entsprechend der bereits von den regulären Ausdrücken bekannten Notation kann in geschweiften Klammern angegeben werden, wie viele beliebige Worte auftreten sollen.
count("GERMAPARL", query = '"([Kk]riminell.*|Straftat.*)" []{0,5} "Asyl.*"', cqp = TRUE, breakdown = TRUE) %>%
head(n = 3) %>% subset(select = c("match", "count", "share"))
## match count share
## 1: Straftaten gegen Asylunterkünfte 5 26.32
## 2: Straftaten gegen Asylbewerberunterkünfte 3 15.79
## 3: kriminelle Asylbewerber 2 10.53