BERTとは何か? Googleの新自然言語処理の影響について

「BERTとは何か? Googleの新自然言語処理の影響について」のアイキャッチ画像

BERTとは、グーグル社が検索エンジンに導入した最新の自然言語処理技術のことをいいます。
日本語ではバートと呼ばれていますが、正式にはBidirectional Encoder Representations from Transformersを省略した表現になります。
その上2018年にグーグル社が発表した当初は、「ついにAIが人間を超えた」といって随分話題になりました。
そしてその翌年には、アメリカのグーグル検索に導入されています。
ただし導入当初は、英語検索のみでした。
ところが同年末には、日本語を含む70以上の国の言語も検索可能となっています。
そういう意味では、グーグル社がこれまで幾度となくアルゴリズムをアップデートしてきた中でも最大級ともいえるでしょうね。
そのためBERTアルゴリズムとも呼ばれています。
ここでは、そんな気になるBERTについてご紹介いたします。

新自然言語処理技術のBERTについて

BERTについては、グーグル社が新たに導入した検索エンジンの一種であるということ自体は理解できたかと思います。
次に自然言語処理技術についてですが、その前に自然言語とは日本語や英語・フランス語のように、人間が意思疎通のために日頃使っている言語のことをいいます。
従って、私たちが日頃使っている言語を機械で処理することが可能になった技術ということになります。
ただし今回ご紹介しているBERTの場合には、スマートスピーカーなどでお馴染みのように、日頃使っている日常会話のみでコンピューターの操作が可能になったという点にあります。
そもそもこうした日常会話をコンピューターが処理できるのは、最近よく耳にする人工知能・AIが利用されているからです。
ここでは多くの人に注目を浴びているBERTの特徴や導入の経緯について、さらに詳しくご紹介したいと思います。

BERTの特徴

すでにご紹介した内容からBERTの大まかな特徴は理解できたのではないでしょうか。
おまけにスマートホンに話しかけるだけで調べたい言語をすぐに検索をしてくれるといったことは、もう利用しているよ!という方も多いのではないでしょうか。
その上、通常の話し言葉だけでなく長い文章や論文といった書き言葉に至るまで、その言葉の意味を解析しながら処理をしてくれるというのだから驚いてしまいます。
従ってBERTの最大ともいえる特徴は、こうした文章における文脈を理解できることだともいえます。
ちなみに従来の自然言語処理技術というのは、人間が日頃話す言葉や文章の中でも単語については理解が可能でした。
ところがそれぞれの単語については理解できるものの、単語同士の繋がりや文脈を読み取るといったことまではできませんでした。
といいますのは文章を単一方向に読み取っていくため、単語の意味は理解できるものの文章全体の意図や文脈までは理解できなかったのです。
そのためグーグルで何等かの検索をした際にも、本来ユーザーが求めている検索結果にまでは至らないということがよくありました。
その点BERTは、文章を単一方向ではなく双方向に読み取ることが可能なのです。
それによって文章全体の意図や文脈まで読み取ることが可能になったのです。

BERT導入の経緯

それではどうしてグーグル社が、こうしたBERTを導入するようになったのでしょうか?
それには、多くのユーザーが様々な端末から検索エンジンを利用するようになったからに他なりません。
何せこれまでは、パソコンから検索エンジンを利用する人がほとんどでした。
ところがスマホやタブレット端末の利用者が増えたため、そうした多様化するユーザーに対応しないといけなくなったからだといえます。
その他にも、検索ワードの多様化も大きな要因として挙げられます。
といいますのは、グーグルのサイトで検索されるワードにこれまでなかったような新しいワードが度々検索されるようになったといわれています。
要するにこれまでのような辞書に載っているような口語検索ではなくて、話し言葉に近いような真新しい言語が検索される機会が増えたからです。
またすでに申し上げたように、ユーザーが求めているような文章全体の意図や文脈まで読み取ることができるため、検索結果自体も大幅に改善されるようになります。
事実グーグル社は、BERTを導入したことにより「検索の精度が高くなった」と公表しています。

BERT導入後の対策について

SEO対策をする際には、今回ご紹介しているようなグーグルのアルゴリズムのアップデートは聞き捨てならないことです。
要するに自社のホームページやブログ等をより上位に表示させるといったSEO対策をする上において、グーグルのアルゴリズムのアップデートにもうまく対応していく必要があるからです。
ここではそんなグーグルのアルゴリズムのアップデート、つまりはBERT導入後の対策についてご紹介いたします。

単語だけでなく文章も認識される

すでに申し上げた内容から、従来の検索クエリは単語のみでした。
ところがグーグル社がBERTを導入して以降は、文章も認識されるようになりました。
そのため文章がタイトルと異なると、検索結果も自ずと異なった結果となります。
そうしたことからもタイトルと文章の内容を一致させたコンテンツにする必要があるといえるでしょうね。
あるいは文章そのものにもBERT対策が必要です。
例えば文章が簡潔にうまくまとめられていると、グーグルの検索エンジンにも理解されやすくなります。
もちろんそうなると、検索順位も自ずと上位に表示されるようになります。
ところが文章がやたらに長くて、何を言おうとしているのかが理解しにくいとグーグルの検索エンジンも同様の解釈をしてしまうことになります。
その結果、検索順位も上位に表示されにくくなるに違いありません。
また、BERTが文章を理解できるようになったとはいっても、あくまでも正しい文法による文章というものに限定されます。
やはり文法がおかしい文章や誤字脱字等も気を付ける必要があるといえます。
とくに文章が長いと、主語と述語の関係が分かりづらくなります。
そういう意味では、主語と述語の関係は明確にさせておく必要があるでしょうね。

検索ユーザーにとってニーズの高いコンテンツが重要

すでに申し上げたことは、文章が分かりやすいという点に注意をするということでした。
その他にも、見落としてはいけないことがあります。
それはグーグルの検索サイトを利用するユーザーに対して、ニーズの高いコンテンツを提供するということです。
やはりユーザーにとってニーズの低い需要度の低いコンテンツというのは、例え文章が分かりやすくても検索順位が上位になることはありません。
やはりグーグル社にとって、検索サイトを利用するユーザーというのはお客様です。
従って、グーグルを利用するユーザーに喜ばれるようなコンテンツを提供しない限りにおいてSEO対策にはなりません。
おまけにグーグル社では、さらに多くのユーザーに利用してもらうために「今回のBERTについてもまだまだ発展途上なので、今後も改善を続ける」といった旨のことを公表しています。
またBERTは、検索ワードの単語を解析するだけでなく、文章まで解析が可能になったといわれています。
これはもう少し噛み砕いて申しますと、文章を単語に分解をしてそれぞれの単語の繋がりを解析してしまうのです。
それによって単語同士の関連性の高いもの同士を結ぶ付けることによって、文脈まで解析できるようになったのです。
そうしたことからこれまでのSEO対策の常とう手段でもあった、検索されやすいキーワードだけを並べたコンテンツではダメなのです。
そういう意味では、これまでのような小手先のSEO対策ではなくて、もっと本質的なSEO対策が必要になったといえるのではないでしょうか。

まとめ

2019年からグーグル社が新たに導入したBERTと呼ばれるアルゴリズムのアップデートについてご紹介しました。
それによって、小手先だけのSEO対策とは違って、より本質的なSEO対策が求められるようになりました。
そのためコンテンツをネットにアップする際にも、BERTを意識したコンテンツ制作が必要だといえます。