AIエージェント用の簡易Leaderboardを作ってみた2025-12-02最小のAIエージェントは数行で書ける時代ですが、継続的な改善・運用には難しさがあると考えています。 そこで、今回はAIエージェントの改善や評価
生成AI活用の鍵は「出力だけ見てレビューできるか?」2025-10-29生成AIを使って文書を書いてもらったり、コードを生成してもらったりする機会が増えています。 ただ、生成された成果物をどうやってレビューするか。
主要なAIエージェントフレームワークのリンク集2025-10-13 (Last Modified: 2025-12-06)世は大AIエージェント時代なのだが、主要なフレームワークだけでもたくさん存在する。 そんなわけで、今後調査するときのためにリストアップしてまと
StreamlitのアプリをPyInstaller+GitHub Actionsでビルドする2025-10-12概要 Streamlitで作ったPythonのアプリを頒布するため、WindowsやMacで実行可能な形式でビルドしたい。 そのためGitHub
Claude Codeを使ってブログ記事から人物像を分析してみた2025-08-22きっかけ Claude Codeを使っていて感じたことの一つに「優れたタスク分解能力と、自律的な遂行能力」があります。 これによって複数のファイルを柔軟に参
重炭酸入浴剤で心身のコンディションを整える2025-08-14きっかけ 以下のような理由から、最近は高濃度炭酸泉へ頻繁に通っていた。 自律神経、特に副交感神経を整えたい ストレスで血圧が上昇する場合があり、血
AIは「耳の痛いこと」を言ってはくれない2025-07-09最近、AIがユーザに寄り添いすぎた回答をすることが話題になっていたので、これを機に書き残しておく。 AIが「心地よい回答」を生成する、2つの構
LLMを使って仮説の自動抽出と分析・可視化を試してみた2025-06-27きっかけ LLMの登場により、自然言語の加工・整形や数値化(ベクトル化)が容易になりました。 そこで「自然言語から普遍的な仮説(教訓や法則など)
Claude Codeのプロンプトやツール定義を探ってみた2025-06-26きっかけ Claude Codeを初めて触ったとき、ClaudeやClineを使うのとは大きく異なる印象を受けました。 これはコンテキストの使い方が上手いの
Claude Codeを触ってみて感じたこと2025-06-23GitHub Copilot Coding Agentも一息ついたので、ここ最近はClaude Codeを試しています。 今日は触ってみた印象をまとめてみます。 ずっとほしかったLLM