内容
入力	`日本の首都は？`
出力	`<think>ユーザーは日本の首都について質問している。これは事実に基づく知識（Fact-based QA）である。私の知識によれば、日本の首都は東京である。</think>東京です。`

LLM勉強会〜基礎からエージェント設計まで〜

悪いプロンプト例1

# 指示
新入社員向けのビジネスマナー研修で使う、プレゼンテーション資料（1時間枠）の構成案を作成してください。

## 研修の目的
この研修のゴールは、新しく入社した社員たちが社会人としての基本的なマナーを身につけることです。
彼らが学生気分を払拭し、プロフェッショナルとして振る舞えるようになることが重要です。
対象は新入社員なので、とにかく分かりやすく、平易な言葉で説明することが求められます。

## ターゲット層
対象者は、当然ながら新卒入社の社員です。
彼らはビジネスの現場経験がまったくないことを前提に資料を作る必要があります。
したがって、専門用語や業界用語は絶対に使わず、具体的な事例をたくさん出して説明するようにしてください。
新入社員は集中力が続きにくいので、一方的な講義にならないよう工夫も必要です。

## 資料で扱うべき内容
資料全体は1時間程度で終わるようにしてください。
内容は、社会人としての基本である「挨拶と言葉遣い」「正しい身だしなみ」「電話応対の基本」「ビジネスメール作成のルール」を網羅的に含めてほしいです。
あと、これが一番大事なのですが、昨今の情勢を鑑み、情報セキュリティとコンプライアンスの重要性を理解してもらうため、
個人情報の取り扱いやSNS利用に関する簡単なクイズを、絶対に資料の最後に入れてください。これは必須項目です。
彼らが飽きないように、途中で簡単なグループワークやディスカッションを入れる案も欲しいです。

## トーン＆マナー
新入社員が萎縮しないよう、基本的には親しみやすいトーンがいいですが、ビジネスマナーという真面目な内容を教える場なので、ある程度の緊張感も必要です。
堅苦しすぎず、かつ馴れ馴れしくない、バランスの取れた文体でお願いします。新入社員が飽きずに最後まで参加できるような雰囲気作りが大切です。

手法	例え	学習のさせ方
事前学習	義務教育	言葉、計算、一般常識を学ぶ。まだ料理はできない
ファインチューニング	料理学校	「このレシピ通りに作りなさい」と教わる → 基礎的な調理スキルと知識を身につける
強化学習	実地研修	客に出した料理に対して「美味しい」「塩辛い」と評価される → 客が喜ぶ味付けや、好まれる接客を身につける

比較項目	ファインチューニング	強化学習
主な目的	指示従順性の獲得: 特定の形式や知識を教え込む	人間との調和: 安全性、有用性、ニュアンスを調整する
データ形式	「入力」と「正解」のペア例：`Q:首都は?` `A:東京`	回答の「比較」や「採点」例：`回答A > 回答B`、`GOOD/BAD`など
学習の仕組み	次単語の予測 (Token Level) 正解データと一言一句合わせようとする	報酬スコアの最大化 (Sentence Level) 文章全体としての良し悪しを評価
得意なこと	・新しい知識の注入・JSONなど特殊形式の出力・口調（キャラ付け）の固定	・嘘（ハルシネーション）の抑制・有害な回答の回避・「もっと丁寧に」など曖昧な指示への対応

LLM勉強会

基礎からエージェント設計まで

Tomoki Yoshida (birder)️

みなさんの3時間絶対に無駄にしません！

今日の流れ

イントロダクション

こんなこと思ったことありませんか？

背景

狙い

今日みなさんが目指す姿

エンジニア

非エンジニア

環境設定

情報の取り扱い注意

今日の勉強会では業務データ入力禁止

後半演習の一部でn8nを使いますが見られても良いデータのみ可

知識 ～前半～

いろんなLLM

何がどう優れているの？どう違うの？

LLMの仕組み

Next Token Prediction

こんなのでうまく答えられるの？

Instruction Tuning

Reasoning / Thinking とは？

プロンプトエンジニアリング

基本テクニック

プロンプトチューニングでうまくいかないときに...

指示をどんどん足しまくらないで！！！

AIに適当に修正させないで！！

プロンプトの洗練

良い例と悪い例をいくつか紹介

悪いプロンプト例1

先程のプロンプトの悪いところ

同じ指示の重複

重要な指示が真ん中に来ている

長々と書いている

改善したプロンプト例1

悪い例2

改善例2

実践演習（ハンズオン）〜前半〜

基礎: APIを呼ぶ

演習A1: 入力された文から趣味を単語で抽出してみよう

演習A2: 温度を調整して出力の差を感じよう

基礎: APIを呼ぶ

演習A3: 思考のON/OFFを切り替えてレイテンシの差を感じよう

演習A4: 連続的な対話の履歴を管理しよう

構造化出力を体験する

演習B: ECサイトに寄せられたコメントを処理する

演習B1: コメントがポジティブかネガティブかクラス分類してみよう

構造化出力を体験する

演習B2: コメントから「商品名」 「ポジティブな点」 「ネガティブな点」を抽出して「5段階のスコア」をつけてみよう

演習B3: コメントをカテゴリ別に分類し、各カテゴリでポジティブ/ネガティブな点を抽出してみよう

複数LLMに分ける

演習C: 技術記事のドラフトを多角的に分析・改善するシステムを作ろう

複数LLMに分ける

複数LLMに分ける

演習C1: 複数の評価軸を別々で処理してみよう

演習C2: 評価結果を使って、記事を修正してみよう

演習C3: 修正・評価ループを作る（エンジニアのみ）

解説A

（ネタバレしたくない方はここで戻ってください）

解説A1~A3: 基本, 温度, 思考の設定（genai）

解説A1~A3: 基本, 温度, 思考の設定（LangChain）

解説A4: 対話（genai）

解説A4: 対話（LangChain）

解説B

（ネタバレしたくない方はここで戻ってください）

解説B1: 構造化出力（genai）

解説B1: 構造化出力（LangChain）

解説B2,B3: より複雑な構造化出力

解説C

（ネタバレしたくない方はここで戻ってください）

解説C: 構造化出力の組み合わせ

知識 ～後半～

フィードバックループを持ち成長するプロダクト

作りたいですよね？

LLM時代のデータ活用

プロダクト全体の最適化

ユーザー個人への最適化（パーソナライズ）

モデル学習の種類とイメージ

知識～前半～

演習B2: コメントから「商品名」「ポジティブな点」「ネガティブな点」を抽出して「5段階のスコア」をつけてみよう

知識～後半～