Brave日本語コミュニティの皆様、はじめまして。
表題にもありますように、Brave Searchの検索結果において国内の一部のウェブサイトが文字化けして表示されている問題を報告いたします。本件はBrave Search専用のコミュニティにも英文で投稿しておりますが、内容が日本語圏特有のものである故こちらでも投稿させていただきます。
先日、日本国内のWeb検索に特化したGoggleをいくつかBrave公式サイトにて提出しました(github)が、その中でもAbe HiroshiというGoggleを使用して検索した際、検索結果に出てくるサイトのリンクおよび概要欄のほとんどが文字化けして表示されていることに気づきました。検証のため、Brave・Google・Duckduckgoの各検索エンジンで当Goggleに索引されてあるドメインを「site:」検索演算子を用いて検索したところ、この問題はBrave特有のものであると結論するに至りました。
Brave Searchの仕様には全く門外漢であるため憶測の域を出ませんが、個人的な考えでは国内の古いウェブサイトの多くがUTF-8ではなくShift_JISによってエンコードされていることが原因ではないかと推測しています。Braveに勤められておられる開発者の方々がこの問題を認知し、解明していただけることを望みます。
@tonsooton こんにちは。
先にこちらのスレッドに回答いたしましたが、ご報告いただきました事象については検索チームに報告し調査をさせていただきます。
またお気づきの点がありましたらぜひお知らせください。また、Brave Searchでは匿名のフィードバックもできますのでよろしければご活用ください。
ちなみに私も少し前に自分でgogglesルールを作成したことがあるのですが、なかなか思ったように検索結果がでなくて四苦八苦した記憶があります。Brave Search自体日進月歩で日本語に対する反応も向上してはいるのですが、なかなかまだニッチなところは手が届かない部分もありますね。
以上、よろしくお願いいたします。
1 Like
ご親身に返信くださりありがとうございます。この問題に関連する事象を個人でも調査していましたが、1年半ほど前に当フォーラムにてISO-8859-1というUTF-8とは別のラテンアルファベットの文字コードがBrave Searchにて正しく表示されていないという問題が報告されていたのを発見しました。
@atsushisa さまのお役に立てればと存じます。
@tonsooton こんにちは。
文字化けの件、Searchチームにて対応を行なっていますが、いきなり全ての文字化けを解決できるわけではなく、徐々にまずは新たにクローリングされるWebサイトから適用が開始されます。今後段階を経て文字化けの表示は減少していくことを見込んでいますのでどうぞよろしくお願いいたします。
またお気づきの点がありましたらぜひお知らせください。