
高性能・高品質なPCが、一般市場に出回るようになって井上久しい今日この頃ですが、その事とは全く関係ありませんが(だったら枕にするなよ) 、近頃「生成AI」なるものが、腸・大はやりだそうです。
どれだけ世間の常識に疎い貴兄も「OpenAI」の「ChatGPT」なるサービスを、目と耳と鼻と口にしたことはないでしょうか。
これまでのインターネットの検索サービスは、言葉の単語単語を羅列して、コツコツと調べ物をした結果を出力するだけだった(←暴論)が一般的でしたが、「ChatGPT」は、思いついた文章をそのままペロリンチョと入力するだけで、頭と大腸と性格の悪い、便秘で頻尿症の筆者にも分かるような平易な文章で回答を導き出してくれるという優れものです。
これまでのこの手のサービスは、知らない事については「知らない」と回答してにべもなかったのですが、「ChatGPT」は、わりと知ったかぶりでテキトーな事を答えてくれるので、一時期、芸能人Youtuberのオモチャとして動画が多数公開され、大いに笑わせて貰えましたが、ここ最近は、だんだんトボけた回答も少なくなってきたのでは……?という気がしないでもありません。
ちなみにライバル社も続々と競合サービスをリリースしています。
つい最近は、生成AI(≒お兄ちゃん)のことなんかぜんぜん好きじゃないんだからねっ!!的ユーザーの悪の巣窟である「X」で「Grok 3」 のサービスが開始され、反AIユーザーの間でたちまち阿鼻叫喚となり、「Bluesky」へ難民が多量に押しかけて大きな社会問題になっているとかいないとか。まあ知ったこっちゃないですが。
そんな中、鮮烈にデビューを果たしたのが「DeepSeek」。これまで生成AIのシステム構築には超大なリソース、もといウスターソースが必要で、利用者は高額な費用負担を必要としていたのですが、「DeepSeek」の利用料は基本タダという太っ腹。しかも開発元は、安心と安全の中国製と、全方向に対してぬめりや抜かりもありません。
しかしそんななろう界最高最強の「DeepSeek」も、「蒸留」するのにコッソリ既存の生成AIを使っているからズルいの!やーのやーの!……と憤りを感じている人もいるようで、ようするにほとんどの人がよく分からずに混沌としております。本記事ではそのあたりをちょっと、ちょっとちょっと!適当に整理して、来るべき新時代に備えるだけにしておきたいと思います。
目次
そもそも「生成AI」、そしてその代表格の「ChatGPT」とは何ぞや?

「なんや、そこから始めるんかいな……。」という話になりますが、文字数ノルマ稼ぎの為にあえてやります。
従来のAIは、分類や予測といった業務に特化をしておりますが、「生成AI」とは、入力データを基に新しいコンテンツを生成する人工知能の一種です。主に、テキスト・画像・音声・動画などを生成するAIモデルが存在し、創造的な作業の支援と効率化を行う技術として、只今急速に発展しています。
生成AIにはいくつかの種類があります。
- 会話型(自然言語処理/NLP) AI……先述のChatGPT・Gemini・Copilot・Meta AI・Grok 3など。人間がフツーに会話する内容を認識してれる超ナイスなAI。「形態素解析」「構文解析」「意味解析」「文脈解析」という4つの工程が順番に行われることにより。前後の文章の関係性や文脈を分析してテキトーな回答をしてくれる優れものです。
- 画像生成系AI……DALL-E,Stable Diffusionなど。DALL-Eは、ChatGPTから使えます。Stable Diffusionは、PCにインストールしてローカル環境で稼働させる人が増えています。その場合、ムフフな画像もテキトーに気兼ね制限無く生成できます、しね。
- 音楽生成系AI……Sunoの性能がやはり頭一つ飛び出ているかな。Sunoで作曲されたとされる「弥助やないかい」はあまりにも有名。こんな隠れた名曲もテキトーにカンタンに作れます。
で、「ChatGPT」とは一体何ぞや?
で、「ChatGPT」とは、カンタンに説明すると、OpenAIが公開した自然言語処理(NLP)ベースの生成AIです。
「GPT(Generative Pre-trained Transformer)」と呼ばれる機械学習モデルを基盤としています。ユカイに説明すると、Transformerアーキテクチャ(時系列データを逐次処理する必要なく、回帰型ニューラルネットワークよりも、はるかに多くの並列化が可能になる深層学習モデル)により、何だかイイ感じで文書の生成や翻訳などの、自然言語処理に合わせてナイスなチューニングができるという、小賢しい特徴をもっています 。
また、「事前学習(Pre-training)」・「微調整(Fine-tuning)」という仕組みにより、各処理に必要なデータ量が限定的であっても、そこそこ動いてくれます。
そんな「ChatGPT」は、いまや翻訳やビジネスや教育分野、プログラミングコードのおせっせだけでなく、音楽、小説、絵画・イラストなどのクリエイティブな方面にも頭角を現し、おまんまの食い上げになりそうなクリエーター達のヘイトを一心に集め、SNS界隈では地獄の様相を呈しているようです。
特にHIKAKINは、もとい最近の生成AIは、スマホの画像情報などを元に、音声で会話をしながら物事を進められたりする、いわゆる「マルチモーダル(複数の異なるデータ=モダリティを統合して処理するシステム。いわゆる画像も動画も文章もミソもクソも一緒にまとめてドンとこいや、という奴。「モータルコンバット」とはちょっとだけ違います。)」な入力方法にも対応していたりなんかして、現在真・三國無双状態です。そんな中、突然、とある新興企業が新しい大規模言語モデルを発表して大騒ぎになっています。それが「DeepSeek」です。
何で「DeepSeek」とやらが脅威なの?

「Deepseek」は、DeepSeek(ディープシーク、深度求索)」は、中国・浙江省杭州市を拠点とする「梁文鋒」によって設立・運営されているヘッジファンドです。「幻方量化」による資金提供を主に受けている人工知能研究所であり、「ChatGPT」のシステムが非公開なのに対して、なんとオープンソースの大規模言語モデルを開発、公開しています。(厳密には「DeepSeek」は、学習済みのAIモデルのみを公開する「オープンウェイト」です。トレーニング手法はお兄ちゃんには内緒。)
もちろん今どきの生成AIなら必須条件とも言えるマルチモーダル対応であるのは言うまでもなく、開発者向けのAPIも提供されているので、自社システムへの組み込みも至極安価で、お手軽カンタンに利用可能。webサービスで使うのであればDeepSeekの使用料自体はゼロ円です。しかも!なんと!ローカル環境でも使えるそうです。ようするに、Stable Diffusionみたいに、コンピューターにインストールをして、あんな事やこんな事も出来てしまうと言うこと。これは熱盛!もとい胸熱!
オープンソースである事による事に対して、既存のAIサービスとの対性能比を心配する人がいる可能性もゼロではない可能性がゼロではありませんが、各所で比較テストを行った結果も、ChatGPTと比較して、それほど遜色ないんじゃない……厳密にはまだCharGPTの方がちょびっと上かな……のレベルくらいには達しているみたいなのです。なんと!
- オープンソースとは
オープンコラボレーション(「平等主義」、「メリトクラシー(メランコラリーではない)」、「自己組織化」という三つの原則に基づくコラボレーション。少年ジャンプの「友情・努力・勝利」とはまた異なる)を促進する目的で、コンピュータプログラムの著作権の一部を放棄し、ソースコードの自由な利用および頒布を万人に許可する、ソフトウェア開発モデルのことを指します、ようするに「著作権の主張はあんまりしないで、皆の愛と勇気だけが友達のシステムのアイデアを出し合ったり作りあったりして、より良い物にしていこうよ!」という崇高な理念の元で作られます。
誰もがプログラムの中味を見られて、改良を加えられる仕組みって、そもそもセキュリティ的に一体どうなんだ、大丈夫なんかいな、と感じる諸兄も居られるかもしれませんが、例えば暗号生成化プログラムがオープンソースだったとして、暗号化する仕組みが誰もが分かる様になっていても、暗号化の鍵さえ分からない様にさえしておけば、まず破られないような暗号自体はちゃんと生成できて、しかも悪さをしないプログラムのルーチンを、皆で確認、チェックしあうことが出来るわけなので、それってかえって安全なのでは?……という考え方も出来るのです。
特定の個人がその人だけで作った、パトレイバーのHOSみたいなプログラムには、何か怪しい、その人だけが享受できる抜け道や、ウィルスみたいなものを仕込まれても、すぐには分からない可能性があるのですから、オープンソースにするのもそれなりの意義があるという訳です。
で、対抗馬となりうる「ChatGPT」が、まともな言語モデルを使おうとするのであれば、やはり有料プランが必要(月20$~200$)となるのに対して、かたやほぼ無料で似たようなサービスを提供してくれちゃうのですから、「OpenAI」的にはキムタクばりに、「DeepSeek」に対して、「ちょ、待てよ」と言いたくもなる訳ですよね。そのお気持ちは分かる。show must go on.
そこで界隈で囁かれているのは、「DeepSeek」は先行サービスの「ChatGPT」などで得られた「蒸留されたデータ」を元にAIモデルを作っているんじゃね?それってイチから自分のシステムで学習したんじゃないから安価で提供できるのってズルくね?」というものです。
「蒸留」とは?

「蒸留」とは、まずは、高性能な大規模モデル(教師モデル)を学習させて、その結果を、小規模モデル(生徒モデル)に学習させることです 。
これをガンガン繰り返すことで、生徒モデルは、少ないリソースでも、いずれ教師モデルに近い性能を獲得出来る様になります。蒸留元に必要な大規模モデルを維持運用するには、莫大な費用と手間がかかるので、おおむねどこの生成AIの開発元でも、自社のサービスを勝手に教師モデルに使わないでね、自分とこのAIで蒸留してね、お願いお兄ちゃん、という規約を設けているのですが、「DeepSeek」はその辺大丈夫なの?ChatGPTとかに『あいのり』しているんじゃないの……?という疑惑が持たれている訳です(「オープンソース」ではなく「オープンウェイト」なのも、お足元がクサいと言われる理由かも?)。
ただ明確な証拠は掴めていませんし、使う側にとっては、安価な高性能なサービスがお手軽簡単に使えればそれに越したことはないので、この辺各社、話し合って上手いことやってほしいものです。まあ裏側ではお互いぶん殴り合っているような世界なんでしょうけれど。
- 「DeepSeek」の危険性
ご存じのように、「DeepSeek」の開発元は、安心と安全の中国製なので、個人情報の漏洩の心配をする人も少なくはありません。
ChatGPTは、ユーザー自身の入力データを学習に使われないようにする機能がありますが、「DeepSeek」にはその機能がないので危険だ、また、スマホアプリでは、現時点ではユーザーが入力したデータやデバイスのメタデータが暗号化されていなくてだだ漏れっぽい?ので、
GIGAZINE/DeepSeekのAndroidアプリはどのようなデータを収集して中国へ送信しているのか?
https://gigazine.net/news/20250219-deepseek-android-app-security/
The Verge/DeepSeek database left user data, chat histories exposed for anyone to see
https://www.theverge.com/news/603163/deepseek-breach-ai-security-database-exposed
「個人情報保護法違反」や「秘密保持契約(NDA)違反」なんじゃね?ともごく一部の人に言われています。ナルホドと思います。よって西側諸国では利用を禁止している国も多い様です。そういう意味じゃあ日本は危機感が今市市(いまいちし)に薄いですね。
あらぬ心配をしなくて済むように、出来れば自国産で安価な生成AIサービスの登場を待ちたい所ですね(ただし国産だから安心とは限らない)!
ただ、「DeepSeek」もローカル環境で動かせば情報漏洩しないのでは、という説もあります。完全にネットワークから遮断すれば確かに漏洩はしないかもしれませんが、ネット社会の昨今、そこまでして使う意味があるのやら。ちょっとくらいはあるのかな。
ともあれ、ChatGPTのサブスクリプションも最近はおサイフに堪えますので、蒸留でも醸造でも何でもいいので、どなたか永続的にワタクシにChatGPTのProプランを永年支援してくださいませ。
ではジャ、マタ |/// |(Д´ )ノ”| ///|ウィーン。
参考文献
Wikipedia/OpenAI
Wikipedia/生成的人工知能
Wikipedia/ChatGPT
Wikipedia/Grok
SkyIT TOPICS/自然言語処理(NLP)とは? 流れ・活用事例をわかりやすく解説
Wikipedia/GPT (言語モデル)
Wikipedia/DeepSeek
Wikipedia/オープンソース
Wikipedia/アプリケーションプログラミングインタフェース
Forbes Japan/DeepSeekを疑うOpenAI、学習に用いたという技術「蒸留」とは?
日経XTECH/DeepSeek利用のリスクを2人の専門家が指摘、収集データの「多さ」と「扱い」を注視