私の知る限り、これが理論言語学の最大の問題です。言語学は証拠の(量ではなく)質を気にする必要があります。
無理に厳密科学のモノ真似をしなくて良いと 割り切れる
言語学の証拠の質を問う
これは、すべての言語研究結果が無価値であるという意味ではなく、証拠の質が問題になるべきではないということです。これは統計学者にとって通常の世界ではありません。他の統計学者にはもっと寛大な事情がある。 。
言語学は疫学者と(普通の)統計学者のどちらに近いのでしょうか?上記の質問に対する答えが疫学者であれば、以下のことをさらに拡張することができます。言語学を統計分析に還元することはできません。
言語方法論における 3 つの問題点を指摘します。
非互換性 , I 観察の軽視 , II 権威主義と過 度の直観依存
現在の(理論的)言語学では、観察の重要性はまったく理解されておらず、強調されていません。私の意見では、理論言語学には少なくとも 3 つの問題があります。中にはカエル(別名特化○.か)が多すぎます。
たくさんの(質の悪い)言語論文や研究書を読むよりも、物理科学における観察、記述、説明の関係を理解できるという保証はありません。そしてこれらすべてのことは、[統計学者にとっては完全に理にかなっています] 。しかし、[普通の]人が 2 つの物事の間に関連性があるかどうかを知りたい場合、[普通の]人は単に何が起こったのかを調査し、注意を払い、検討し、または思い出すだけです。起こらなかった。どうやら人々は長い間この間違いを犯してきました。 。
ほぼ4世紀前、哲学者で科学者のフランシス・ベーコン卿は、心の誤りやすさについて書きました。
疫学の問題設定 1
心構えとして
可能であれば、説明と説明を測定可能なデータに結び付けます。正しいか間違っているか判断できない記述や記述は拒否する姿勢を持ちましょう。これは証拠の質を向上させるために不可欠です。
技術的問題として
Rは有効ですか? (たとえば、構文構造はツリー状構造ですか?) 構文構造はラティスでも木構造でもありませんか?一般に、ブラケットのパラドックスのすべての例は、樹枝状構造を使用して説明されます。
許容性の判断・判断 許容性の判断の実態の解明 (e)メント=その統計的実態を十分に理解する。許容性はスケールの変化で構成され、連続分布です。許容できるか、許容できないかの二項対立。非常に許容できる <=> 低許容。
ただし、クラスタ 2 がさらに 2 つに分岐していることからわかるように、許容分布は非線形 (おそらくシグモイド) です。
講演者からの挑戦 1
これは、R のグループ分析の結果が 3 つのグループに分かれていることからもわかります。
講演者からの挑戦 2
言語学は直観なしでやるべきでしょうか?言語学と言語処理の関係を整理する 言語学は言語研究の基礎分野であり、言語処理は応用分野です。
科学が基礎部門より先に応用部門で進歩することは珍しいことではありません (実際、それはより一般的です) 統計 (部門) を言語学 (部門) に置き換えると、数学/言語学はコンピューター サイエンスであることがわかります 私は数学/ ではないと思いますアルゴリズムとアルゴリズムが存在する限り、言語学は完全に時代遅れになります。
私は言語学を応用統計に還元できるとは考えていません。
追加する論点 1
モステラー氏が考えた問題は、「ハミルトンが 52 回目の論文を書いた」などの 1 回限りの出来事に対処するためにサンプリング理論を使用するのが難しいことです。 [確率的解釈としての]ベイズの信頼度を具体的に述べるのは難しいですが、広範囲に応用できるはずです。データの急増と、誰でも使用できる使いやすい分析ツール/ソフトウェア。ベイズ主義の普及に貢献したリンドリーは、1965 年から自分のコンピューターをプログラミングしています。計算には最適だと思いました。 「公理とデータを入力したら、あとはコンピューターを算術の法則に従わせるだけです。」リンドリーに言わせれば。
彼は「確率論」というタイトルの 2 巻の本を英語に翻訳し、この疑問を世界に投げかけました。このようにして、多くの英米系統計学者がデ・フィネッティの主観主義的アプローチを初めて利用することができました。 [さらに]、スミスはフィルターを開発しました。この実用的な計算上の創意工夫は、空間統計と疫学におけるベイズ統計問題を解決するために必要な、ユーザーフレンドリーで効率的なソフトウェアの開発につながりました。やることにしました。コンピュータ化された言語コーパスは、今や誰でも利用できるデータです。
しかし、言語研究の外部の人でも使いやすい分析ツール/ソフトウェアはあるのでしょうか? 。