わがまま科学者の英語講座

科学系の英語だけでなく、広く「英語」についての話題

究極の英単語リストUVL10000(β版)を無料公開(その1)

私は、日本の英語教育で欠けているのは、英語そのものを学ぶことではなく、英語で様々な知識を得ることができるようになるという観点だと思っています。Wikipediaの項目数では、英語は日本語の5倍の項目があります。それぞれの項目も10倍くらいの内容があるものが多い。英語で得られる情報量は日本語で得られる情報量の100倍とか、1000倍くらいありそうな感覚を私は持っています。自然科学の論文などは英語でしか存在しないのが基本です。

           f:id:dufay:20180721101138j:plain

英語では、例えばインドの情報も日本語では比べ物にならないくらいの量存在しています。つまり、日本語だけで情報を得ている人というのは、この地球にある人類が持つ知識の1000分の1しか見ていないということになるのではないかと思います。これはもったいないです。英語で知識を得れば、もっと人生は豊かになる可能性があります(逆に、毒になる可能性もありますが。)。

 

もちろん、これからは人工知能を利用した自動翻訳も発達してくるでしょう。でも、それだけでは不十分ですし、10-20年待てない、結局は正しさを確認するのは、オリジナルの英文を読まないとわからないというケースも多いでしょう。

 

そこで、英語圏のネイティブ教養人(大学、大学院修了)の語彙レベルを目指すための1万語の究極の単語リストThe Ultimate Vocabulary List (UVL)10000(β版)を暫定公開します。このリストは、1晩で作ったものではありません。私が、20年近く費やして作ってきたリストです。自動翻訳が発達して無駄にならない前に公開したいと思っていましたが、ようやくある程度の形あるものになりました。

             f:id:dufay:20180621174956j:plain

常にオープンソースであることを目指しますので、ファイルの頒布は自由ですが、有効性の把握のためにCredit(私が作製したという情報)だけは必ず維持してください。 個人で利用する限り、メモを記入したり、内容の変更、編集も自由です。 ただし、これはインプットを得るためのベータ版ですので、今後、変更があることをご承知おきください(改善のためのご意見を希望します)。

 

ダウンロードはこちらから↓ 

UVL10000-Ver-beta1-MY.xlsx - Google ドライブ

 

注意点

このリストは、 英語圏のネイティブ教養人(大学、大学院修了)の語彙レベルを目指すというものですので、日本の高校レベルの単語も不安があるような場合は利用が早すぎます。下の方に、日本で発売されている典型的な単語集へのリンクをつけておきましたので、それらをまずやって、大学入試レベルの単語、英検準1級程度なら、すべて単語を知っているというレベルになってください(目安:センター英語・英検2級=4000語、英検準1級=7000語、英検1級=13000語、本UVLの目指す水準18000語)。

 

1)使用者は、日本の大学生、大学院生、一般人で、例えば英語のニュース記事や本を本格的に読めるようになりたいというようなレベルから、英語圏のネイティブ教養人(大学、大学院卒)の語彙レベルを目指すというレベルにまで対応しています。目的は、英語で様々な分野の知識を得るレベルになることです。

 

おそらく、このリストを身につけると、派生語などの理解も可能になり、自分の専門分野の専門語(例えば、医学英語)と合わせると、英語圏のネイティブ教養人(大学、大学院卒)の語彙レベルに到達できるはずです。

 

2)一般に市販されているネイティブのためのボキャビルのリストに加え、TOEFL, SAT(大学), GRE(一般の大学院), MCAT(メディカルスクール), GMAT(ビジネススクール), LSAT(ロースクール)の試験準備のために必要とされる多数のネイティブ向けの単語リスト(数十のリスト)を比較検討し、重複語がないように集めました。したがって、GREなどの試験準備のための単語リストに掲載されている単語はすべて網羅されているはずです(収録されるべき単語があったら、是非お知らせください)。

 

3)科学技術情報やグローバルな情報に溢れた時代のためのリストです。理数系の基本語、理数系の文章でよく使う単語、英米文化や生活についての単語を収録する一方、昔の文学作品でのみ見かけるような単語を除きました。日本の中学、高校で必須レベルの簡単な単語は取り除きました。一方、簡単に見える単語でも、複雑な意味がある単語は残してあります。意外に簡単な単語が含まれていますが、何らかの意味があるということです。

 

4)派生語、品詞の違う単語は、使用頻度が多いと思われるものは、積極的に残しました。その結果、冗長性が見られますが、学習には有用なはずです。

 

5)日本語の訳はGoogle翻訳にファイルをアップロードして、自動翻訳させたものです。したがって、明らかにおかしいものが大部分で、全く不完全なものです(見ない方がよいです😎) )

        f:id:dufay:20180721095002j:plain

(上のドキュメントのところから、エクセルファイルをアップロードします)

これは、本来、英語の辞書(英英辞書)の利用を想定しているためです。また、英和辞書の著作権の問題もあります(協力していただける出版社はないでしょうか)。この点については、現在、Pythonを使って効率的に自動化して行う方法を開発中です。また、単語の選択について、出現頻度など科学的なエビデンスを得る方法(簡単にはGoogle検索でヒットする数など)についても、検討する予定です。

 

改善するべき点などがありましたら、是非、お知らせください。文化系、情報科学系問わず、共同研究に関心のある方がおられましたら、ご連絡ください。

 

UVL10000   (The Ultimate Vocabulary List 10000)

Version beta1.0    (July 2018)

Credit: 山形方人 (連絡先:yamagatm@gmail.com)