ソニーの法林です。 先日、fj.unix, fj.questions.unixに、 > ソニーの法林です。 > > とある方面から私に次のような依頼がやってきました。 > > 「chown, chmod, awk ですが、関西出身の私はいつも『ちょうん、ちぇん >じもっど、おーく』と読んでいたのですが、つい先頃関東に転勤になって回 >りの呼び方を聞いてみると『おーく』を『えーだぶりゅーけー』と呼ぶよう >なのです。そこで、『おーく』と『えーだぶりゅーけー』との境が日本国内 >のどこにあるかを探してみて欲しいのです。」 > > 以前から、「UNIXのいろいろなコマンドを皆は何と読んでいるのか」という >ことに興味があったので、ここはひとつ私が探偵となって調べてみようと思い >ます。 という記事を投稿しましたところ、非常に多数の方から回答をいただきました。 皆さん本当にありがとうございます。回答の集計結果と、それに関する考察を行 いましたので、ここに報告をさせていただきます。ただ、めちゃめちゃ長いです。 400行ぐらいになってしまいました。 (注) 当初は、調査にご協力してくださった方にはメールで結果をお送りする予 定だったのですが、回答数があまりに多いので、ニュースの記事を見て回答して くださった方への報告はこの記事をもって代えさせていただきます。また、この 報告の内容は4月28日にjus関西UNIX研究会の中で発表しましたので、fj.unix, fj.questions.unixの他にfj.jusにも投稿します。 1. 問題とその背景 1.1 背景 この問題の背景としては、「UNIX用語英単語を省略したものが多いため、読み を特定しにくい」という現象があると考えられます。例として使われたchmodや awkの他にも、同様の例は少し考えただけでも数多くあるでしょう。 今回の調査と同様の研究としては、かつてfj.unixに「UNIX用語 由来/読み方 辞書」という記事が投稿されています[1]。これは、数多くのUNIX用語について、 その読み方や語源などを調べた貴重な文献です。しかし、この文献は読み方の種 類については情報量が多いのですが、ある用語に対してどの種の読み方が多いか といった定量的な調査結果はあまり載っていません。そこで、今回の調査では定 量的な面に重点を置いた調査を行ってみました。 1.2 調査方法 調査は、以下に述べるような質問項目を設けてのアンケートを実施することに よって行いました。 (1) chmodを何と読むか?(回答はひらがなで) (2) awkを何と読むか?(回答はひらがなで) (3) サイト名 (4) サイトの所在地 awkとchmodを選んだ理由ですが、awkに関しては最初に調査を依頼された時の 内容が「関東と関西でawkの読み方が違うのは本当か?」というものだったから です。chmodについては、おそらく多種多様な読み方が出て面白い結果になるの ではないかと私が思ったので入れました。 回答者が容易に答えられるようにすることで、できるだけ多くの人に答えても らいたいと思い、調査項目を読み方の種類と地域およびサイト名のみにしました。 用語を2つだけにしたのは、いろんな用語について一度に調査すると集計するの が大変だからです(^_^;)。 皆様のおかげで、実に180人という多数の方が回答を寄せてくださいました。 では、その集計結果をお見せしましょう。 2. awkに関する調査結果 2.1 総計 「awkを何と読むか?」に対する回答の集計結果を以下の表に示します。 読み方 比率 備考 ------------------------------------------------------------------------- おーく 86.0% 「うぉーく、おぅーく、ぅおぉく、おぉく」を含む おうく 9.5% 「おぅく、あぅく、あうく、あうぇーく」を含む えーだぶりゅけー 3.9% 「えーだぶりゅーけい、えーだぶりゅーけー」を含む 無回答 0.6% 質問への回答はないが結果は見たいという人:-) ------------------------------------------------------------------------- 回答を大まかにパターン分けすると「おーく」「おうく」「えーだぶりゅけー」 の3つになります。そして、実に95%もの人が「おーく」もしくはそれに近い読 み方をしていることがわかります。 当初の予定では「おーく」と「えーだぶりゅけー」の境界が日本のどこにある かを探すことになっていたのですが、この時点でそれはあきらめました。:-) 2.2 読み方の理由 皆さんから寄せられた回答の中には、質問への回答以外にコメントを入れて下 さった方が多数おられました。その中から、なぜ「おーく」あるいは「えーだぶ りゅけー」と読むかについての理由が書かれたコメントを抜き出して紹介します。 ・「おーく」派 ほとんどの人は、「プログラミング言語AWK」(Aho,Kernighan,Weinberger著) [2]という本の「訳者の序」にある文章を根拠に挙げています。それによると、 「Kernighan先生にお聞きしたところ、「AWK」は[おーく]と発音し、A・W・Kと は決して言ってはならない、とのことである」とあります。つまり、「作者が言 うんやから間違いないやろ」:-)という考え方ですね。 ・「えーだぶりゅけー」派 こちらは「開発者3人の頭文字に由来するから」という理由の方が多く(とい っても元々の人数が少ないので大した数ではないが)おられました。つまり、仮 にAhoさんがBhoさんだったら「びーだぶりゅけー」と読んでいたであろうという 考え方です。 2.3 「おーく」と「えーだぶりゅけー」の境界に関する考察 2.1で述べたように、大多数の方が「おーく」と発音することがわかってしま ったので、地域/サイトによる境界線を引くことは無理だろうと判断しました。 しかし、本当に「おーく」と「えーだぶりゅけー」の境界は何もなく、単にユー ザの好みだけで決まるのでしょうか? 「えーだぶりゅけー」と読むユーザ達に 何か特徴はないだろうかと思い、該当する方々に以下のような追加質問をお願い しました。 [追加質問項目] (1) UNIX使用年数 (2) awkをどこで知ったか (3) awkを「えーだぶりゅけー」と読む理由 これらの質問に対する回答と、それに対する考察は以下の通りです。 ・UNIX使用年数 平均でおよそ3年弱、大半の人が2年ほどでした。今回の調査の回答者全員にこ の質問をして比較したかったのですが、時間の都合でそれはできませんでした。 そこで、他に同様の調査を行った例はないか調べたところ、jus会員アンケート [3]の項目に「UNIX使用年数」というのがあることを聞き、その回答の一部(現 在集計中)をサンプルとして見せていただきいたところ、6年以上という方が40% 強、4〜5年という方がやはり40%強、3年以下という方は15%程度でした。 回答の母集団が違うので正しい比較とは言えないのですが、この結果を見ると 「えーだぶりゅけー」と読む人は平均的UNIXユーザに比べるとキャリアが短いと いうことがうかがえます。 ・awkをどこで知ったか ・awkを「えーだぶりゅけー」と読む理由 まず、awkの認知媒体としては、UNIX Magazineなどの雑誌や本によると答えた 人がほとんどで、他の人から伝え聞いて初めて知ったという人は少数でした。そ れから、「えーだぶりゅけー」と読む理由については2.3節で掲げたような理由 を挙げておられる方もいましたが、大半は「なんとなく」あるいは「読み方がわ からないのでとりあえず『えーだぶりゅけー』と読んだ」という方でした。 つまり、「えーだぶりゅけー」と読む人々はawkというツールを音よりもまず 文字で認知したため、他の人からの伝聞であれば「おーく」という読み方を教え られる確率が高いところを独自の読み方で読むようになったのではないか、と考 えられます。当初「えーだぶりゅけー」と読んでいたユーザが、他のユーザと交 わるうちに読み方を「おーく」に変更したという例も聞いています。 これらの追加質問の結果と考察から、「おーく」と「えーだぶりゅけー」との 境界は単なる好みだけではなく、UNIX経験の長さや認知媒体に依存するのではな いかと考えられます。 3. chmodに関する調査結果 3.1 総計 「chmodを何と読むか?」に対する回答の集計結果を以下の表に示します。 読み方 比率 備考 ----------------------------------------------------------------------------- ちぇんじもーど 39.7% 「ちぇぃんじもーど、ちぇんじもぉど」を含む ちぇんじもっど 27.4% 「ちえんじもっど、ちぇじもっど、ちぇんもっど」を含む しーえっちもっど 10.6% 「しーえいちもっど」を含む ちもっど 8.4% ちもど 4.5% ちぇもど 3.4% その他 5.6% ちぇんじもど、しーえいちもど、しーえっちもーど、 ちゅもっど、ちゅもど、ちょもど 無回答 0.6% 質問への回答はないが結果は見たいという人:-) ----------------------------------------------------------------------------- 私の予想どおり、実にさまざまな読み方が登場しました。とりあえず上の表の ようにまとめてみましたが、類似する読み方が多いのでパターン分けは非常に難 しいです。全体的に見ると「ちぇんじもーど」「ちぇんじもっど」と読む人が一 番多く、これに「しーえっちもっど」「ちもっど」を加えた4つが主な読み方と 言えるでしょう。 3.2 読み方のパターン分け chmodに関しては、3.1節の表のようなパターン分けの他に、もう少し細かい類 型化を行いました。具体的に言うと、回答者全員がchmodをchとmodに分けて発音 していることに注目し、それぞれの部分ごとの発音でパターン分けを行ったとい うことです。その結果を以下の表に示します。 ------------------------+------+------+----+----+ chとmodの読み方 |もーど|もっど|もど|合計| ------------------------+------+------+----+----+ しーえっち、しーえいち | 1| 19| 2| 22| ちぇんじ、ちぇじ、ちぇん| 71| 49| 3| 123| ちぇ、ちゅ、ちょ | 0| 1| 9| 10| ち | 0| 15| 8| 23| ------------------------+------+------+----+----+ 合計 | 72| 84| 22| 178| ------------------------+------+------+----+----+ これを見ると、 ・modを「もーど」(mode)と読む人は、ほぼ例外なくchも「ちぇんじ」(chenge) と読む。 ・chを「ち」「ちぇ」などのように短く言う人は、modも同様に「もっど」「も ど」と短く言う傾向が強い。 ・chmodの発音としては「ちぇんじもーど」が一番多いのに、部分ごとの発音で は「もーど」より「もっど」の方が多い。 といったことがわかります。 3.3 地域別に見たchmodの読み方分布 3.1節の結果を地域別に集計したものを示します。 ------+--------+--------+----------+--------+--+----+ |ちぇんじ|ちぇんじ|しーえっち|ちもっど|他|合計| | もーど| もっど| もっど| | | | ------+--------+--------+----------+--------+--+----+ 北日本| 2| 4| 0| 0| 1| 7| 関東 | 6| 1| 1| 0| 0| 8| 東京 | 18| 19| 5| 4|12| 58| 神奈川| 17| 4| 3| 7|10| 41| 中部 | 10| 5| 1| 0| 2| 18| 近畿 | 13| 13| 4| 4|10| 38| 西日本| 3| 2| 2| 0| 0| 7| 外国 | 1| 0| 0| 0| 0| 1| ------+--------+--------+----------+--------+--+----+ 合計 | 68| 46| 15| 15|34| 178| ------+--------+--------+----------+--------+--+----+ (注) 北日本:北海道・東北、西日本:中国・九州(四国は0)、 外国:ロサンゼルス 東京・神奈川・近畿といった大都市圏にはユーザが多く、そのせいか多種多様 な読み方が発生しています。また、大都市圏でも読み方の分布がそれぞれの地域 で大きく異なります。東京・大阪では「ちぇんじもーど」「ちぇんじもっど」が ほぼ同数なのに対して、神奈川では「ちぇんじもっど」が少なく、また「ちもっ ど」が多いという特徴があります。 ただ、地域別にもっと顕著な特徴が出ることを期待したのですが、あまり大き な特徴は出ませんでした。この時点で、chmodの読み方についても分布図を書く ことはあきらめました:-)。 3.4 サイト別に見たchmodの読み方 ここではサイト別の集計結果をお見せしますが、非常に多数のサイトの方が回 答してくださったため、すべてのサイトについての集計を行う時間はありません でした。そこで、特に回答者数の多い10のサイトを選んで集計を行いました。そ の結果を以下の表に示します。 ------+--------+--------+----------+--------+--+----+ |ちぇんじ|ちぇんじ|しーえっち|ちもっど|他|合計| | もーど| もっど| もっど| | | | ------+--------+--------+----------+--------+--+----+ 慶応大| 3| 1| 0| 5| 3| 12| SRA| 6| 3| 0| 0| 0| 9| ソニー| 4| 1| 1| 1| 2| 9| 富士通| 6| 1| 0| 0| 1| 8| 松下 | 1| 2| 0| 1| 3| 7| NTT| 3| 2| 0| 0| 2| 7| 阪大 | 3| 1| 1| 1| 0| 6| 東大 | 2| 1| 1| 0| 1| 5| 京大 | 1| 0| 0| 1| 3| 5| ------+--------+--------+----------+--------+--+----+ 合計 | 68| 46| 15| 15|34| 178| ------+--------+--------+----------+--------+--+----+ ここで注目すべきは慶応大学の結果です。他のサイトでは全体の結果と同様に 「ちぇんじもーど」や「ちぇんじもっど」が多数を占めるのに、慶応だけはなぜ か「ちもっど」が一番多いのです。ここから、「サイトごとにある特定の読み方 が多く存在することがあるのではないか?」という推測が成り立ちます。ただ、 サンプルが10人程度という少数なので、もっとサンプルを増やしたら違う結果に なるかもしれません:-)。 4. 考察 3章までは、回答者から寄せられたデータの分析と、それに対する考察を行っ てきました。この章ではそれらの結果を総合的に検討し、さらに考察をしてみま す。 4.1 UNIX用語の方言性 今回の調査の背景になったのは、「UNIX用語の読み方が人によって異なる」と いう現象でした。同じ動作や物の呼び方が人によって異なるという現象は日常生 活でもあることで、それがいわゆる「方言」です。私は、今回の調査を「UNIX用 語における方言の調査」というとらえ方で見てみることにしました。 そこでまず、日常生活で用いている言葉(日常語)における方言について、そ の形成過程や要因を調べ、UNIX用語との共通点や相違点を調べてみます。 4.2 日常語における方言 まず、日常語における方言について書かれてある文献を調べてみました[4]。 それによると、日常語における言語形成は後から種々の方言に分化するのではな く、先にいろいろな地方で存在していた方言が次第に共通語化してゆくというプ ロセスをたどるらしいということでした。そして、ある人の言語を形成に強く作 用する要因として、次の3つが挙げられていました。 (1) 生育・居住条件:両親や友人の影響、出身地、転居の有無 (2) 経歴的条件:学歴、マスコミの利用度、発音教育 (3) 自然的条件:年齢、性別 4.3 awk,chmodの読み方分布から見たUNIX用語の言語形成要因 2〜3章で得られたawkやchmodの読み方についての結果は、言語形成におけるど のような要因に基づくものかを考えてみます。 2.3節では、awkを「おーく」と読むか「えーだぶりゅけー」と読むかの違いに ついて、UNIX使用年数や認知媒体が影響するのではないかと述べました。UNIX使 用年数を日常語における言語形成要因に対応させるなら、「自然的条件」の中の 「年齢」が当てはまると考えます。 また、文献などの認知媒体を見ていたかどうかで読み方が変わるというのは、 「経歴的条件」の中の「マスコミの利用度」がそれに該当すると思います。ただ、 日常語の「マスコミの利用度」は「マスコミをよく利用している人は比較的共通 語に近い言葉を使う」という現象なのですが、UNIX用語の場合は逆に「文献など の文字情報で知識を得た人は、耳で知識を得た人に比べて独自の読み方をするこ とが多い」という現象となって表れます。 3.4節では、慶応に「ちもっど」と読む人が多いことを取り上げました。これ は、あるサイトの中で特定の読み方が多いことの例なのですが、日常語で「両親 や友人の影響」や「出身地」が大きく影響するのと同様、UNIX用語でも友人や先 輩などの影響、そしてその人がUNIX教育を受けたサイトで読み方が決まるのでは ないかと考えられます。 一方、サイト別の読み方分布を見ると、一つのサイトでもさまざまな読み方の 種類が存在することがわかります。これには2つの原因があると考えられます。 一つは、日常語における「転居の有無」に対応する現象で、例えば大学でUNIX教 育を受け、その読み方のまま就職などでサイトを移った人が数多くいるからでしょ う。もう一つは、先ほども出ましたが、同じサイト内でも文献などによる文字情 報でそのツールを知った人が独自の読み方をすることに原因があると思われます。 4.4 日常語とUNIX用語での言語形成要因の類似点・相違点 以上の考察を踏まえて、日常語の言語形成要因とそれに対応すると思われる UNIX用語の言語形成要因を以下の表にまとめてみました。 |日常語 |UNIX用語 --------------+----------------+---------------------------------------- 生育・居住条件|両親や友人の影響|友人や恩師の影響 |出身地 |UNIXを覚えたサイト |転居の有無 |UNIX利用サイト異動の有無(就職など) --------------+----------------+---------------------------------------- 経歴的条件 |学歴 |(影響しないと思われる) |マスコミの利用度|文献の利用度(注) |発音教育 |友人・恩師の発音をまねる程度。特に発音を | |指導されることは少ないと思われる。 --------------+----------------+---------------------------------------- 自然的条件 |年齢 |UNIX使用年数 |性別 |(影響しないと思われる) --------------+----------------+---------------------------------------- (注) 日常語における「マスコミの利用度」とは、新聞やテレビなどをよく利用 している人はより共通語化が進んでいるというもの。UNIX用語における「文献の 利用度」とは、文献によって学んだ人は恩師や友人から学んだ人に比べて独自の 読み方をすることが多いというもの。 また、日常語の言語形成とUNIX用語におけるそれには次のような違いがありま す。「読み方の変化」の項目は、ある用語の読み方が多種多様なものになること に影響していると思われます。 |日常語 |UNIX用語 --------------+---------------------------+------------------------ 歴史の長さ |1000年以上 |10数年 --------------+---------------------------+------------------------ 読み方の変化 |その土地の読み方に従う |勤務地が変わっても |傾向が強い(関西人を除く:-))|読み方を変える人は少ない --------------+---------------------------+------------------------ 5. まとめ 5.1 結論 今回の調査では、awk,chmodという2つのUNIX用語を例に挙げ、読み方の種類や 人数を調べました。さらに、UNIX用語のさまざまな読み方を方言としてとらえ、 UNIX用語の読み方を形成する要因について考察を行ないました。 結果として、UNIX用語のさまざまな読み方は単なる好みだけで決まるのではな く、周囲の人々の読み方などに影響を受けること、またサイトなどの集団で見る と特定の読み方が多く存在し、それが集団によって異なる場合があるらしいこと、 などがわかりました。 5.2 問題点と残された課題 問題点としては、以下のようなことが挙げられます。 (1) 今回の調査項目の中には、回答者が受けたUNIX教育について調べる項目があ りませんでした。例えば、UNIXをサイトや使用年数などです。 できるだけ回答者が答えやすいように設問を少なくしたのですが、回答に「ど こでUNIXを覚えたかも調べた方がいいのでは?」とコメントして下さった方が多 数おられました。このような項目についても調査するともっといろいろなことが わかったかもしれません。 (2) 今回の調査は、主としてfjニュースグループでアンケート調査を行いました が、fjを読んでいるユーザがUNIXユーザのすべてではありません。「fjの特殊性」 というか、fjを読んでないユーザを相手にするとまた違った結果が出るかもしれ ませんので、その辺を考慮したいと思いました。 また、今後に残された課題を以下に掲げます。 (1) さらに多くの種類の用語について調査を行い、読み方の分布を調べること。 (2) 言語形成に影響を及ぼす集団の単位や要因についてさらに考察し、実験結果 と合わせて確かめること。 これらの課題を私がやるということではありません:-)。この結果を読んだ読 者の方々がさらに調査を進め、より詳しい結果や新たな説を提唱することを期待 しています。 6. 感想 調査を始めたのが確か2月の終わり頃(実は覚えてません(^_^;))、3月いっぱい は回答を待ち、4月に入ってから集計を始めました。しかし、あまりのデータの 多さに、一時はこんなのまとめ切れるんだろうかと思いました。しかし、周囲の 方々の励ましや、わざわざ回答を寄せてくださった方々のために少しでも意味の ある結果を出そうという気持ちで、なんとかここまでこぎつけることができまし た。少しは大きな仕事をしたかいなという気持ちになれてうれしいです。 回答者の中には、回答以外にいろいろなコメントを寄せてくださった方が多く、 非常に参考になりました。「こんなコマンドについても調べて欲しい」とか「こ んな読み方は納得いかん」とか、もうそれはそれはさまざまです:-)。 特に目立ったものとして、awkを「おーく」と読む方に「awkを『えーだぶりゅ けー』と読むなんて邪道だ」という方が多かったですね。確かに著者達が書いた 本の中で「awkは『おーく』と読む」と書いてありますし、そう読む人が多いこ とは事実でしょう。僕も「おーく」と読みます。しかし、僕はコマンドの読み方 などというものは人それぞれ、好きなように読めばいいと思っていますし、コマ ンドの読み方ぐらいでケチをつけるようなことはしないで、「いろんな読み方を する人がいるんだな」という広い心で接していきたいと思いました。 #ただ、あまりにも変な読み方すると相手に伝わらないので、多少は気を付けた #方がいいような気はします:-)。 7. 謝辞 今回の調査を行うにあたり、調査する機会を与えてくださった神余探偵局長:-) @三菱電機をはじめとする「UNIX探偵団」の皆様、ならびに私のつたない発表を 笑いで盛り上げてくださった、高野さん@松下藩UNIX奉行をはじめとする jus関西の皆様に厚くお礼申し上げます。 それから、データの集計作業を手伝って下さった中川さん@京大に深く感謝し ます。まさかUNIXデータを医者に診てもらうことになるとは思いませんでした:-)。 また、jus関西での発表資料やこの報告文を作る環境を快く提供してくださった やまおかさん@とうこうだいに深謝します。jus関西での発表の練習相手を務め、 数々の貴重なアドバイスをくださった職場の同僚の皆さんに感謝します。 そして、私のアンケート調査に回答し、貴重なデータとなってくださったおよ そ180人もの方々に、心から感謝致します。そして最後に、このやたら長い文章 を最後まで読んで下さった読者の皆さん、本当にどうもありがとうございました。 この報告についての意見などありましたら、ニュースへの投稿なり、私あての メールなりで送ってください。私のメールアドレスは、 hourin@meis.sony.co.jp です。 8. 参考文献 [1] 「UNIX用語 由来/読み方辞書」、前橋孝広@名鉄コンピュータサービス、 Message-ID: (fj.unix) [2] 「プログラミング言語AWK」、Aho,Kernighan,Weinberger、足立高徳訳、 トッパン [3] jus会員アンケート、jus会報「/etc/wall」1993年7月号収録予定 [4] 「日本の方言」、柴田武、岩波書店