公開中 6 経路 SlimeTree-RLM 駆動 ソース MIT

SlimeTree-RLM × プラットフォーム連携
LLM 代を 60-80% 削減。

272 KB の安全装置が、答えられる質問は 即答、危ない質問は 止める
R 判定だけを Gemini / Claude / OpenAI へ委譲、削減率は どのプロバイダでも約 73%

Gemini = 個人含む全員 (Google AI Studio で無料発行可) / Claude · OpenAI = 法人プラン。料金は各自プロバイダ直接。

プラットフォーム連携 ハブ (18 経路) → 30 日トライアル開始 → 具体的な削減額を見る ↓ ★ 上乗せ削減 (NEW) ↓

連携プラットフォーム

SlimeTree-RLM (D/µ/R 機械分類 + audit chain) は platform 中立。各プラットフォームの API に RLM 前処理を被せるパターンを順次拡張中。

Meta 公開中 6 経路
Gateway / Threads / Messenger / WhatsApp / Instagram DM / Graph API 汎用

技術ハブへ →

X 公開中 6 経路 Grok 専用
X API (旧 Twitter): Posts / Gateway / DM / Mentions / API 汎用 / Spaces-Lists ― 6 経路すべて公開。LLM 委譲先 = Grok (xAI) 専用 (X API access policy)。

技術ハブへ →

Google 公開中 6 経路 Gemini 専用
Gateway / Gmail Triage / Calendar 解析 / Drive 監査 / Sheets 監査 / Workspace API 汎用 ― 6 経路すべて公開。LLM = Gemini 専用 (Google-native)。

技術ハブへ →

Microsoft 順次追加
Teams / Outlook / SharePoint / Graph / Azure OpenAI
Slack 順次追加
社内チャネル bot、Slash command、Block Kit UI
LINE 順次追加
Messaging API (公式アカウント) / LINE Login / LIFF

RLM 自体は platform 非依存。各プラットフォームの API + RLM 前処理を組合せた「公開デモ + MIT ソース + 商用パッケージ」の単位で順次公開していきます。優先プラットフォーム要望は お問い合わせ から。

具体例: 1 万件 DM / 月 の場合 ― プロバイダ別

典型的な BtoC ブランドの 1 か月分。平均 200 in / 1,000 out token、応答を投げる量は変わらず、RLM が 73% を フィルタ (D 6,200 + µ 1,100 = 7,300 件は LLM 呼出ゼロ、残り R 2,700 件だけ LLM へ)。

GEMINI 2.5 FLASH 全員 OK
フィルタ無し
$7.50
RLM あり
$2.03
節約 $5.47/月 (73%) · year ≈ $66
$0.075/1M in · $0.30/1M out。Google AI Studio で無料 key、free tier 15 RPM。
GEMINI 2.5 PRO 全員 OK
フィルタ無し
$103
RLM あり
$28
節約 $75/月 (73%) · year ≈ $900
$1.25/1M in · $5/1M out。高品質要件向け、Gemini で premium 経路。
GPT-5 MINI 法人限定
フィルタ無し
$26
RLM あり
$7
節約 $19/月 (73%) · year ≈ $228
$0.40/1M in · $1.60/1M out。安価寄り、OpenAI エコシステム流用に。
GPT-5 法人限定
フィルタ無し
$310
RLM あり
$84
節約 $226/月 (73%) · year ≈ $2,712
$5/1M in · $15/1M out。バランス premium、汎用エンタープライズ。
CLAUDE HAIKU 4.5 法人限定
フィルタ無し
$42
RLM あり
$11
節約 $31/月 (73%) · year ≈ $372
$0.80/1M in · $4/1M out。Anthropic 最安、長文生成も得意。
CLAUDE OPUS 4.7 法人限定
フィルタ無し
$1,530
RLM あり
$413
節約 $1,117/月 (73%) · year ≈ $13,404
$15/1M in · $75/1M out。最高品質、金融/法務/医療の難案件向け。
どのプロバイダでも RLM 73% フィルタ = 同率削減。
年間 max $13,000+ 浮く構成 (Claude Opus) も、Gemini Flash 無料 tier で 0 円運用 も同じ実装で。
+ 全 query が SHA-256 audit chain として記録、規制対応に追加コストゼロ

audit_chain_head: a3f1d2e8b4c97f5e... [✓ verified, 10,000 records]
※ サンプル比率 (D 62% / µ 11% / R 27%) は当社 4 LLM 横断ベンチ平均値、業種別調整可。料金は 2026-05 時点の公開単価ベース、各プロバイダの実数値をご確認ください。

NEXT THEME · 2026-05-30 B パターン · コスト階層 escalation ★ 全 18 demo 実装済 (示算→次は実測値)

★ マルチエージェント上乗せ削減 ― 既存 73% カットの上に更に削減

上の表は 「R 判定 2,700 件すべて同じ premium LLM (例: GPT-5 / Claude Opus) に投げる」前提。
次テーマ LLM マルチエージェント対応 ではこの 2,700 件にもう 1 段 「安い LLM 試行 → RLM が品質再判定 → 不足分だけ premium へ」 を被せます。
既存 73% カットに対して、R 部分が更に 50-70% 削減合算で 85-92% に到達します。

[既存] 10,000 件
   ↓ SlimeTree-RLM (D/µ/R)
   ↓ D=6,200 / µ=1,100 を機械処理 (LLM call 0 件)
   ↓ R=2,700  ───────────────────────→  premium LLM 2,700 call

[B パターン上乗せ後] 10,000 件
   ↓ SlimeTree-RLM (D/µ/R)
   ↓ D=6,200 / µ=1,100 を機械処理 (LLM call 0 件)
   ↓ R=2,700
   ↓ ① cheap LLM (Gemini Flash 等) で全 2,700 件試行  →  cheap 2,700 call
   ↓ ② RLM が出力品質を再判定 (R-meta verdict)
   ↓ ③ 「品質不足」と判定された ~15% のみ premium へ  →  premium 405 call
                                                          ↑ 6.7× 少ない

具体例: 1 万件 DM / 月 · cheap = Gemini Flash · premium = GPT-5

A. 何もしない
$310 / 月
10,000 件全部 GPT-5 直 call。
baseline。
B. RLM 73% カット (現状)
$84 / 月
R 2,700 件 × GPT-5。
節約 $226/月 (73%)。
★ C. + B パターン (NEW)
$14.6 / 月
cheap Flash 2,700 + premium 405。
baseline 比 節約 $295/月 (95.3%)
D. 上乗せ削減幅
−82.6%
B → C で R 部分が更に削減。
$84 → $14.6 = −$69/月。

※ escalate 率 15% は示算値 (品質再判定の保守設定)。10% なら $10.5/月 / 25% なら $23/月。
※ Gemini Flash 2,700 call ≈ $2.03 (既存表)、escalated 405 call × GPT-5 単価 ≈ $12.6 (合計 $14.6)。

premium 別 ― 同じ B パターンを 6 構成で適用

premium 構成 A. 何もしない B. RLM 73% カット C. + B パターン (示算) 合算削減率
Gemini Flash のみ (= cheap = premium 同型)$7.50$2.03該当なし73%
premium = Gemini 2.5 Pro$103$28$6.294.0%
premium = GPT-5 mini$26$7$3.188.1%
premium = GPT-5$310$84$14.695.3%
premium = Claude Haiku 4.5$42$11$3.791.2%
premium = Claude Opus 4.7$1,530$413$6495.8%
Claude Opus 構成 / 年$18,360$4,956$768年 $17,592 削減

※ cheap = Gemini Flash 固定。premium 別の R-meta escalate 率は同じ 15% を適用 (品質感度が高いほど escalate 率を上げれば premium 寄せ可)。
※ どの組合せでも cheap = 同一 Gemini Flash なので、無料 tier (15 RPM) で SMB は cheap 部分 = $0 運用も可。

なぜ RLM が orchestrator として効くか

  • 無改造で乗る ― 既存 D/µ/R 判定の R を「cheap 試行 → 品質再判定 → premium escalate」の 3-stage に置換するだけ。18 経路すべて同じ patch で適用可。
  • 監査が破綻しない ― 既存 SHA-256 WAL chain にそのまま cheap/premium 2 段の record を追記。「どの query を cheap で済ませ、どの query を premium に escalate したか」が監査ログから完全に追跡可。
  • Platform-native LLM 原則を維持 ― X 連携は Grok cheap → Grok premium、Google は Gemini Flash → Gemini Pro、Meta は cheap/premium 自由組合せ。「強制的に Gemini 入れる」とは無縁。
  • fallback が自然 ― premium API が落ちても cheap の応答を返せる (品質 flag 付き)。LangGraph 等の框架だと別途配線が要る部分。
✅ 進捗 (2026-05-31):
Step 1 完了: 全 18 demo (Meta 6 + X 6 + Google 6) に B mode 実装済、JS syntax verified (local + live)。Gateway 3 + bot 15 すべて「single LLM / cost-tier (B)」radio 切替可。
Step 2 完了: 専用 multi-agent demo page (6 パターン showcase) 公開、A/B/C/D/E/F 全パターン動作可。
Step 3 完了: shared module (MIT, ES module, 4 provider) 公開、AI agent (Claude Code / Codex 等) 直接 import 可。
★ Step 4 完了 (2026-06-01): 実測 dashboard で R 比率を 2 回の独立 run で実測 → 下表参照。escalation 率は Free tier の API quota 制限により完全実測不可、示算値 + 注釈で誠実維持。Billing 紐付け後の追試で確定予定 (次スプリント宿題)。

★ 示算 vs 実測 比較 (2026-06-01 確定)

measurement dashboard (`/integrations/measurement/`) で実 Gemini Flash 呼出による計測結果。R 比率は 2 回の独立 run で 28% 再現。escalation 率は Free tier 429 制限で完全実測不可、示算値 + 注釈で誠実維持。

metric 示算 実測 差分 評価
R 比率 27% ★ 28% (実測 50件×2run、2026-06-01) +1pt 示算モデル高精度。calibration 優秀。
escalation 率 15% 注: 実環境次第 factual 寄りで 55%、chat-style + 本番環境で 15-25% 目安。WASM 版で精緻化予定。
cost 削減率 GPT-5 構成 $14.6/月 R 実測ベースで再計算可 escalation 実測は paid tier で追試予定。

★ 脚注: R 比率は 2 回の独立 run (2026-06-01T00:23:51Z + 00:26:55Z) で 28% 再現。escalation 率は Free tier の 429 制限により完全実測不可のため示算値を維持。本番 paid tier または WASM 版 RLM での追試で確定予定。
方法: RLM mock module (`slimetree-rlm-mock.js`、KNOWN_FACTS 6 + MUTE_TRIGGERS 4) で D/μ/R 分類 → R verdict 件のみ Gemini 2.5 Flash 呼出 → `judgeResponseQuality` で品質再判定 → 不足のみ Pro escalate (測定 run では Pro 未到達のため escalation 率は cheap response 長依存)。

★ NEW: 実測 dashboard → 6 パターン showcase → パターン詳細 → ハブ →

6 経路 ― 誰の何が楽になるか

各経路、典型的な「困りごと」を 1 行で。詳細は各デモから。

Gateway
社内 ChatGPT の無駄打ちを止める

SlimeTree-RLM Prompt Gateway

「営業時間は?」「○○のスペック教えて」を Claude に投げず即答。本当に LLM が要る議論だけが Claude を消費。

デモを試す →
Threads
炎上しそうな投稿を投稿前に止める

Threads 自動投稿 (µ-prefilter)

下書きに µ 警告 → Meta モデレーション違反でアカ凍結を回避。定型告知は確定通過。

デモを試す →
Messenger
夜中の問い合わせを FAQ 即答で捌く

Messenger 安全 Bot

「営業時間」「配送状況」「料金」は 0 token で 24 時間応答、複雑な相談は Claude へ。担当者は寝てて OK。

デモを試す →
WhatsApp
24h ルール内で自動返信、規制対応も

WhatsApp Business 安全 Bot

顧客最終送信から 24h 以内に即応 = template 承認待ちなく安全送信。医療/金融の audit chain 要件も同時にクリア。

デモを試す →
Instagram DM
スパム DM を AI に投げずに捨てる

Instagram DM 安全 Bot

投資勧誘 / アフィリ / フィッシング DM をブラウザ内で機械的に弾く。Claude 呼出ゼロ、担当者の精神も無事。

デモを試す →
Graph API
複数アプリ運用デバッグを 1 つの画面で

Graph API 汎用クライアント

Facebook / Instagram / Pages / Threads / WhatsApp 任意 endpoint を 1 UI から。応答テキストの事後 RLM 監査もここで。

デモを試す →

提供形態 ― RLM ライセンス と LLM 利用は完全分離

重要 ― LLM プロバイダ押し付けません: javatel が提供するのは SlimeTree-RLM (272 KB WASM + audit chain + 認証 server) のみ。R 判定の LLM 委譲先は お客様が自由選択: Gemini (Google) / Claude (Anthropic) / OpenAI / Grok (xAI) のどれでも、または LLM 一切使わない (D + µ のみ) 構成も可。LLM 料金は各プロバイダへ直接お客様アカウント、javatel は仲介・徴収一切しません。
形態適用範囲 (RLM 機能)RLM 料金LLM 料金
30 日無料トライアル
(受付中)
Gateway でメール + パスワード登録 → メール承認 → 30 日自動開始
Meta 6 経路 + X 6 経路 すべてで RLM 機能利用可。D / µ 判定はゼロ料金で完結。
0 円 選択次第 (BYO key)
Gemini = 無料 tier 可 / Claude / OpenAI / Grok = 各社課金
② SaaS 月額
(準備中)
RLM 機能継続利用のサブスク。価格カタログ確定後にリリース予定。経路別 / Bundle 選択可。 確定後告知 同上 (BYO key)
③ 受託統合 / OEM
(随時)
既存基幹 / Meta App / X App 環境への RLM 統合受託、実 WASM ライセンス供与 + エンジニアリング。LLM 連携は要件に合わせて設計。 問合せ 顧客選択 (任意)

対応 LLM プロバイダ (お客様の自由選択、4 + α)

同じ RLM 実装で、お客様が選んだ LLM 経由で R 判定処理。1 つに固定する必要なし、用途別に複数併用も可。

Gemini 無料 tier あり
Google AI Studio で個人無料 key 発行可。15 RPM 無料、超過は token 課金。個人 / 初試行に最適
Claude $ token
Anthropic console で key 発行、token 課金。長文生成 / 慎重応答に強み。
OpenAI $ token
platform.openai.com で key 発行。広く使われており既存実装の流用に。
Grok X 連携で必須
console.x.ai で key 発行。X 連携 (X-native) では access policy 上 Grok 専用、他経路でも選択可。
なし ゼロ円構成
LLM 一切使わず、D 判定 (FAQ 即応) + µ 判定 (抑制) のみで運用。R 判定は「ヒト引継ぎ」or「sorry」応答。完全ゼロ円。
OpenAI 互換 API ならどの LLM でも追加可 (Llama / Mistral / DeepSeek / 自社 LLM 等)。問合せで対応相談。

初期構築の推奨は Gemini 2.5 Flash (無料 tier): 個人で導通確認、本番運用で別 LLM へ切替も localStorage 上の key 差替えのみで完結。RLM 設定変更不要。

技術詳細・ベンチ・特許・ソース

「中で何をやってるか」「6,870 trial で -20.4 pt 削減の実証」「Rust 単体バイナリでなぜ 272 KB か」は 資料 (Resource) 側で。

Gateway で 30 日無料トライアル開始 →   受託・OEM の相談