2: 2009-05-16 (土) 14:13:00 taked2 |
現: 2009-06-05 (金) 07:36:32 taked2 |
| + | #freeze |
| * ケンブリッジ変換 [#jc83ae58] | | * ケンブリッジ変換 [#jc83ae58] |
| RIGHT:&tag(言語); | | RIGHT:&tag(言語); |
| http://gimpo.2ch.net/test/read.cgi/news2/1242310992/222 | | http://gimpo.2ch.net/test/read.cgi/news2/1242310992/222 |
| | | |
- | ** 日本語の場合の変換ルールについて [#hc772837] | + | ** 日本語の変換ルールについて [#hc772837] |
| | | |
- | - 英語の場合は単語ごとにスペースで区切られているから文章の区切りが明白である。日本語の場合は、漢字、ひらがな、カタカナ、数字、アルファベットといった文字種の多さに加え、文節の区切りがあいまいであるため、まずきちんとした文節解析を行う必要がある。 | + | - 英語の場合は単語ごとにスペースで区切られているから言葉の区切りが明白である。日本語の場合は、漢字、ひらがな、カタカナ、数字、アルファベットといった文字種の多さに加え、膠着語であるため言葉の区切りがあいまいである。まずきちんとした文節解析を行う必要がある。 |
| - 四字熟語は真ん中の2つを入れ替えるのが一般的。 | | - 四字熟語は真ん中の2つを入れ替えるのが一般的。 |
| + | - 漢字は表意文字であるため文字というより絵に近い。そのため二字熟語を反転しても意味が通じる場合がある。 |
| + | - 日本語は膠着語なので助詞によって単語が連結されている。そのため、漢字+助詞を一単位にするほうが自然である。 |
| + | - 「」、””など括弧でくくられた単語はその中を一単位にする。 |
| + | - カタカナの単語はそれだけで独立していることが多い。通常は他の文字種と混ぜないほうがよい。 |
| + | - 一度に目で認識しているのは5~6文字(最高でも10文字程度)である。 |
| + | - 漢字直前の「お」「ご」、漢字直後の「が」「の」「は」「で」「に」「を」「も」はターミネーターになる可能性が高い。 |
| + | - ひらがなは表音文字であるため、先頭以外の漢字を適度にひらがなに直すとシャッフル度が上がる。 |
Counter: 6504,
today: 2,
yesterday: 2