1: 2009-05-16 (土) 13:58:33 taked2 |
現: 2009-06-05 (金) 07:36:32 taked2 |
| + | #freeze |
| * ケンブリッジ変換 [#jc83ae58] | | * ケンブリッジ変換 [#jc83ae58] |
| RIGHT:&tag(言語); | | RIGHT:&tag(言語); |
| どでうす? ちんゃと よゃちめう でしょ?~ | | どでうす? ちんゃと よゃちめう でしょ?~ |
| ちんゃと よためら はのんう よしろく~ | | ちんゃと よためら はのんう よしろく~ |
| + | |
| + | http://tsushima.2ch.net/test/read.cgi/newsplus/1241732267/2 |
| | | |
| ** 例題2 漢字交じりの場合 [#i929bef6] | | ** 例題2 漢字交じりの場合 [#i929bef6] |
| 「中さ村んと激高たし客が喧寸嘩前なにった。店員がその客をなめだうよと、店外に連れ出たし隙に、彼は五円千札を置いて、逃げし出たでのす」(別の客)~ | | 「中さ村んと激高たし客が喧寸嘩前なにった。店員がその客をなめだうよと、店外に連れ出たし隙に、彼は五円千札を置いて、逃げし出たでのす」(別の客)~ |
| 中氏村は50メトールほど”逃走”した。が、通報を受たけ警官察に身柄を取り押えされらた。~ | | 中氏村は50メトールほど”逃走”した。が、通報を受たけ警官察に身柄を取り押えされらた。~ |
- | 「パカトーの中でも、大声で喚ていたいが、数後分に、知人がきて解放さたれよでうす」(近の住所人) | + | 「パカトーの中でも、大声で喚ていたいが、数後分に、知人がきて解放さたれよでうす」(近の住所人)~ |
| ご本人に、話聞をこう。~ | | ご本人に、話聞をこう。~ |
| 「印税が入たっので、寿司が食べたっかた。たたまま、はっいた店で交事通故に遭ったうよもなの。~ | | 「印税が入たっので、寿司が食べたっかた。たたまま、はっいた店で交事通故に遭ったうよもなの。~ |
| どぞこのアドイルの方が潔いすでぞ。~ | | どぞこのアドイルの方が潔いすでぞ。~ |
| | | |
- | ** 日本語の場合の変換ルールについて [#hc772837] | + | http://gimpo.2ch.net/test/read.cgi/news2/1242310992/222 |
| + | |
| + | ** 日本語の変換ルールについて [#hc772837] |
| | | |
- | - 英語の場合は単語ごとにスペースで区切られているから文章の区切りが明白である。日本語の場合は、漢字、ひらがな、カタカナ、数字、アルファベットといった文字種の多さに加え、文節の区切りがあいまいであるため、まずきちんとした文節解析を行う必要がある。 | + | - 英語の場合は単語ごとにスペースで区切られているから言葉の区切りが明白である。日本語の場合は、漢字、ひらがな、カタカナ、数字、アルファベットといった文字種の多さに加え、膠着語であるため言葉の区切りがあいまいである。まずきちんとした文節解析を行う必要がある。 |
| - 四字熟語は真ん中の2つを入れ替えるのが一般的。 | | - 四字熟語は真ん中の2つを入れ替えるのが一般的。 |
| + | - 漢字は表意文字であるため文字というより絵に近い。そのため二字熟語を反転しても意味が通じる場合がある。 |
| + | - 日本語は膠着語なので助詞によって単語が連結されている。そのため、漢字+助詞を一単位にするほうが自然である。 |
| + | - 「」、””など括弧でくくられた単語はその中を一単位にする。 |
| + | - カタカナの単語はそれだけで独立していることが多い。通常は他の文字種と混ぜないほうがよい。 |
| + | - 一度に目で認識しているのは5~6文字(最高でも10文字程度)である。 |
| + | - 漢字直前の「お」「ご」、漢字直後の「が」「の」「は」「で」「に」「を」「も」はターミネーターになる可能性が高い。 |
| + | - ひらがなは表音文字であるため、先頭以外の漢字を適度にひらがなに直すとシャッフル度が上がる。 |