chamame: https://chamame.ninjal.ac.jp/index.html
Format
A data frame with 21125 rows and 10 variable (column names are escaped by stringi::stri_escape_unicode(), stringi::stri_unescape_unicode() or unescape_utf() will show Japanese)
- text_id
id
- chap
chapter
- sect
section
- para
paragraph
- \u8868\u5c64\u5f62
result of chamame
- \u54c1\u8a5e
result of chamame
- \u54c1\u8a5e\u7d30\u5206\u985e1
result of chamame
- \u54c1\u8a5e\u7d30\u5206\u985e2
result of chamame
- \u54c1\u8a5e\u7d30\u5206\u985e3
result of chamame
- \u539f\u5f62
result of chamame
Examples
data(review_chamame)
review_chamame |>
unescape_utf()
#> # A tibble: 21,125 × 10
#> text_id chap sect para 表層形 品詞 品詞細分類1 品詞細分類2 品詞細分類3
#> <dbl> <dbl> <dbl> <dbl> <chr> <chr> <chr> <chr> <chr>
#> 1 1 1 1 1 農地 名詞 "普通名詞" "一般" ""
#> 2 1 1 1 1 は 助詞 "係助詞" "" ""
#> 3 1 1 1 1 農産 名詞 "普通名詞" "一般" ""
#> 4 1 1 1 1 物 接尾辞 "名詞的" "一般" ""
#> 5 1 1 1 1 を 助詞 "格助詞" "" ""
#> 6 1 1 1 1 生産 名詞 "普通名詞" "サ変可能" ""
#> 7 1 1 1 1 する 動詞 "非自立可能" "" ""
#> 8 1 1 1 1 機能 名詞 "普通名詞" "サ変可能" ""
#> 9 1 1 1 1 だけ 助詞 "副助詞" "" ""
#> 10 1 1 1 1 で 助動詞 "" "" ""
#> # ℹ 21,115 more rows
#> # ℹ 1 more variable: 原形 <chr>