NEW · 2026-05-30 主力サービス展開 · ソース MIT 次テーマ = マルチエージェント

SlimeTree-RLM × プラットフォーム連携 ハブ

各 SNS / 業務プラットフォームの API に RLM 前処理 (D/µ/R 機械分類 + SHA-256 audit chain) を被せる。LLM 代を 60-80% 削減、Gemini / Claude / OpenAI どれでも同じ削減率。

3 プラットフォーム公開
18 経路 (MIT)
★ 18/18 B mode 実装済
60-80% RLM 削減 (+ B で更に削減)
272 KB WASM 1 ファイル

公開 18 経路を見る ↓ マルチエージェント対応 (NEW) ↓ サービスページ →

🎛 AI GATE このページの解説を、あなたの解像度で。

LLM の幻覚(もっともらしい嘘)を、重みを一切変えずに外付けで抑制。3 つの外部ベンチ × 3 seed = 6,870 試行で −20.4 ± 0.3 pt の安定改善を実測。4 種の LLM 横断で 8B 級が 81% 天井に収束する「性能イコライザ」効果。手続き・rubric・seed をすべて公開。

📋 「このレベルで AI に質問」= 選んだ解像度に合った指示つきで、このページの解説をコピーします。お手元の AI(Claude · GPT · Gemini · Grok 等)に貼れば、その目線でさらに深掘りできます。

なぜ「ハブ」を 1 つにまとめたか

全 18 経路は 同じ構造で動きます ― RLM 前処理 (D/µ/R) → R のみ LLM へ → SHA-256 chain。 Platform 別に並べた個別 hub (Meta / X / Google) に加え、「3 platform を横断して見る」ための専用ハブがこのページです。 共通仕様・Platform-native LLM 原則・マルチエージェント拡張 (次テーマ) ― すべてここから入れます。

公開中プラットフォーム (3)

各カード = platform hub への入口。各 platform は 6 経路すべて MIT 公開、ブラウザ単独で動作 (localStorage-only LLM key)。

公開中MetaLLM 中立

Meta 連携 ― 6 経路

Facebook / Threads / Messenger / WhatsApp / Instagram / Graph API 全 6 経路。LLM 委譲は Gemini / Claude / OpenAI 自由選択

Meta hub → 代表デモ

公開中XGrok 専用

X (旧 Twitter) 連携 ― 6 経路

X API v2 + xAI Grok の Platform-native 構成。X account 認可で動作、Grok 委譲で他 LLM の access 制限を回避。

X hub → 代表デモ

公開中GoogleGemini 専用

Google Workspace 連携 ― 6 経路

Gmail / Calendar / Drive / Sheets / Workspace API 全 6 経路。同一 Google アカウント / 1 課金体系Gemini 無料 tier (15 RPM) 利用可

Google hub → 代表デモ

予定 プラットフォーム (3)

追加順 = 需要 + Platform-native LLM 整合のしやすさで判断。

予定MicrosoftAzure OpenAI 専用

Microsoft 365 / Azure 連携

Outlook / Teams / SharePoint / OneDrive / Graph API + Azure OpenAI。Entra ID で全社統合認可、enterprise の主戦場。

準備中

予定SlackLLM 中立

Slack 連携

Channels / DM / App Home / Workflow Builder + 任意 LLM。Slack Marketplace 申請、商用ワークフロー直結。

準備中

予定LINELLM 中立

LINE / LINE WORKS 連携

Messaging API / LINE WORKS / LIFF + 任意 LLM。国内 SMB / 自治体 / コンシューマ向け接点、Webhook 設計済。

準備中

アーキテクチャ ― RLM 前処理 + Platform-native LLM 原則

全 platform で共通の処理パイプ:

[入力 prompt / event]
       ↓
  ┌──────────────────┐
  │  SlimeTree-RLM   │ ← 272 KB WASM、ブラウザ単独
  │  D/μ/R 機械分類  │
  └──────────────────┘
       ↓ (D=即時応答 / μ=機械抑制 / R のみ LLM へ委譲)
  ┌──────────────────┐
  │  Platform-native │ ← Meta=neutral / X=Grok / Google=Gemini
  │       LLM        │
  └──────────────────┘
       ↓
  ┌──────────────────┐
  │ SHA-256 WAL chain│ ← 全 step 監査記録、規制対応
  └──────────────────┘
       ↓
[出力 + audit log]

Platform-native LLM 原則

platform 側 access policy・課金体系・SSO 整合を最重視。「どの LLM でも動く」けれど、その platform で自然な LLMを first-class で扱う。

プラットフォーム標準 LLM理由
Meta (FB / Threads / WhatsApp / Instagram) Gemini / Claude / OpenAI 自由選択 Meta 側に native LLM 紐付なし、ユーザの好きな LLM を中立に支援
X (旧 Twitter) Grok 専用 (xAI) X-native、競合 LLM への直接アクセス制限を回避、X Premium / API tier との整合
Google Workspace Gemini 専用 同一 Google アカウントで Workspace + Gemini 一元管理、無料 tier (15 RPM) あり
Microsoft 365 (予定) Azure OpenAI 専用 Entra ID / Microsoft Purview 統合、enterprise 課金一元化
Slack (予定) 中立 (任意 LLM) Slack 側に native LLM 紐付なし、enterprise 既存 LLM 契約を尊重
LINE (予定) 中立 (任意 LLM) 同上、国内 SMB の LLM 選好が分散している

NEXT THEME · 2026-05-30 既存 18 経路に乗る拡張

★ LLM マルチエージェント対応

RLM を 「単発 LLM 委譲」から「マルチエージェント orchestrator」へ昇格させる次テーマ。
既存 18 経路の構造を一切変えず、R 判定の中身を複数 agentに拡張するだけで成立する設計。

6 パターン候補

優先 1stB

コスト階層 escalation

安い LLM (Gemini Flash) で試行 → RLM が品質判定 (R-meta verdict) → 不足なら高品質 LLM (Claude Opus / GPT-5) へ。
既存 73% カットの上に更に 50-70% 削減。数値が一番ハードに刺さる。

優先 2ndA

クロスバリデーション

2 LLM (Gemini + Claude 等) に同時委譲 → 出力比較。一致 = 統一応答、不一致 = 人手 review flag。
高精度要件 (金融 / 医療 / 法務) 向け。

優先 3rdF

投票 / コンセンサス

N 個の LLM が独立応答 → RLM が aggregator (vote / average)。
一致率 = confidence score。classification / fact-checking 向け。

C

専門エージェント routing

RLM-2 層で domain 分類 (code / legal / medical / general) → 適切 agent + system prompt → LLM 選択。
enterprise multi-domain support 向け。

D

orchestrator-worker

1 LLM が planning → 複数 worker に並列分散 → RLM が結果 merge。
大型タスク parallel 化 (research / 多段問題解決)。

E

debate / critique ループ

LLM A 提案 → LLM B 批評 → A 修正 → 反復。RLM が収束 / 発散検知、loop 上限制御。
code review、文書 drafting 向け。

RLM が orchestrator として優位な理由

項目一般 multi-agent framework (LangGraph 等)RLM 拡張
既存 LLM 呼出 フレームワーク内に閉じる 既存 D/μ/R 判定の R を細分化、無改造で乗る
audit trail フレームワーク独自 log SHA-256 WAL chain が全 agent 呼出を記録、規制対応即適合
cost 削減 agent 設計次第 D/μ 既存削減 (73%) の上に B パターンで更に 50-70% 削減
platform 統合 別途配線 既存 18 経路にそのまま乗る (Meta / X / Google で共通)
LLM 自由選択 多くは provider 固定 Platform-native 原則維持 (X → Grok 多 agent、Meta → Gemini + Claude 同時等)
進捗 (2026-05-31): B (コスト階層) は ★ 全 18 demo 完走。次は A (クロスバリデーション) → F (投票) → C/D/E。B 以外も 専用 demo page で 6 パターンすべて動く実装あり。

★ 動く実装 ― 全 18 demo + 専用 page + shared module 完走 (2026-05-31)

shared module + 18 demo + 専用 page 全てに B mode (cost-tier escalation) 実装済 + JS syntax 検証済 (local + live)。Claude Code / OpenAI Codex 等の AI agent からも直接 import 可

★ shared module (MIT, ES module)

/integrations/slimetree-rlm-multi-llm.js (250 line, 10 export, 4 provider = Gemini/Claude/OpenAI/Grok)
import { callLLMWith, judgeResponseQuality, MODEL_CATALOG } from '...'

専用 demo page (6 パターン showcase + 実測 dashboard)

  • /integrations/multi-agent-demo/ ― A/B/C/D/E/F を 1 page で並列実行、Gemini 1 key (無料 tier 可)
  • ★ NEW: /integrations/measurement/ ― 示算 → 実測値置換のための batch runner dashboard。150 サンプル prompt を Flash → Pro 階段で実行、escalation 率実測 + JSON export

全 18 demo (Gateway 3 + bot 15、全て B mode 実装済)

Meta family (6/6 ✅) ― cross-vendor escalation 自由
Gateway / Threads / Messenger / WhatsApp / Instagram DM / Graph API
X family (6/6 ✅) ― Grok 内段階
Gateway / Posts / DM / Mentions / API / Spaces/Lists
Google family (6/6 ✅) ― Gemini 内段階、Flash 無料 tier 可
Gateway / Gmail / Calendar / Drive / Sheets / Workspace

各 bot に bot-specific extra judge 実装済 (PII 要求 / 断言調 / 競合言及 / 風刺判別 / 役員 keyword / 機密+公開 / クレカ pattern 等 18 種)。enterprise PoC 向けの業務固有 escalation の素地。

★ Local LM 拡張 ― B コスト階層 / C 専門 routing を RTX 5060 Ti 級のオンプレ GPU まで延長

SlimeTree-RLM の R-meta verdict は cloud LLM か local LLM かを問わず同一インターフェースで評価できる。
したがって既存 B (コスト階層) パターンは Gemini Flash の更に下に「Local LLM tier」を挿入することで、トークン単価をほぼゼロまで押し下げられる。

B パターン拡張 ― 4 tier escalation

tier担当 LLMトークン単価RLM verdict 通過時の挙動
Tier 0 (新) Local LM (Gemma 4 12B Q4_K_M / Gemma 3 12B 等) ¥0 / 1M tok (電力のみ) 大半の D/μ 機械処理済 prompt を local で即応答、cloud 課金ゼロ
Tier 1 Gemini Flash (既存) ~¥30 / 1M tok local では verdict 不足 → flash へ
Tier 2 Gemini Pro / Claude Sonnet ~¥500 / 1M tok flash でも品質不足 → pro へ escalate
Tier 3 Claude Opus / GPT-5 ~¥5,000-15,000 / 1M tok frontier 推論必要 → opus へ最終 escalate

削減効果: D/μ で既存 60-80% 削減した残り R 分のうち、70-95% を tier 0/1 で吸収。frontier 課金 (tier 3) は実トラフィックの 3-10%。月次 ¥1M cloud LLM 課金が ¥30-100k に。

RTX 5060 Ti × Gemma 4 12B 実測 (2026-06-05、自社測定)

項目gemma3:12bgemma4:12b Q4_K_Mgemma4:12b Q8_0
decode tok/s46.343.527.6
peak VRAM9.7 GB8.6 GB13.7 GB
RLM judge p99 latency~100 µs~100 µs~100 µs
判定 sufficient 率 (n=50)49/5047/5047/50

測定環境: NVIDIA GeForce RTX 5060 Ti (16 GB) / CUDA 13.1 / ollama 0.30.5 (gemma4 architecture native 対応) / WSL2 Ubuntu / Phase B judge via SlimeTree-RLM R-meta verdict layer。詳細 blog 記事 (準備中)。

企業 Local LM 移行の 4 つの勝ち筋

A

コンプライアンス必須ドメイン

医療 / 法務 / 金融 / 防衛 ― cloud LLM 法令違反の業界。
判定 47/50 sufficient で first-draft + 人手レビュー業務に乗る。SlimeTree-RLM の SHA-256 audit chain が監査要件即適合。

B

高ボリューム定常推論

月 10M tok 以上の routine 処理 (文書分類 / 要約 / draft 作成 / RAG 取込)。
RTX 5060 Ti 1 GPU で 3.6M tok/日 = 月間定常負荷を電気代だけで回せる。3 ヶ月で capex 回収。

C

狭ドメイン specialist

税務 Q&A / 製造 SOP / 病院請求 ルール lookup 等。
LoRA 追加学習で Gemma 4 base が frontier 汎用と並ぶ。SlimeTree-RLM の D/μ/R が品質ゲートを担保。

D

hybrid (B パターン本命)

SlimeTree-RLM R-meta verdict で 90-95% を local 処理 / 5-10% を cloud frontier に escalate
「品質は frontier 同等、課金は 1/10〜1/20」を実トラフィックで実現。

Gemma 4 12B の位置づけ: frontier LLM (Claude / GPT-5 / Gemini Pro) の置換ではなく、specialist tierとして cloud frontier の隣に置く設計。
frontier 推論 / 長 context (100k+) / 対話 sub-2s レイテンシ要件は引き続き cloud。それ以外を local が吸収。

共通仕様 (全 18 経路)

ライセンスMIT (全 18 経路の demo + RLM mock module 含む)、商用利用可
動作ブラウザ単独 (静的 HTML + JS、サーバー側コード不要)
RLM 本体272 KB WASM 1 ファイル、SharedArrayBuffer + Atomics で並列処理
LLM key 保管localStorage 限定、ブラウザ外送信なし。各 LLM provider 直接 API call
audit chainSHA-256 hash chain (WAL)、エクスポート可、改ざん検知
エラー時rollback (非可換側のみ伝播)、特許請求項 21, 35-37
パイプライン視覚化各 demo に live indicator 内蔵、D/μ/R 判定の様子をリアルタイム表示
セキュリティ境界RLM 判定はブラウザ内で完結、LLM への送信は R 判定分のみ
削減効果LLM 代 60-80% 削減 (D/μ で機械処理する分、LLM call 自体が発生しない)

関連ページ

商談・PoC のお問い合わせ