
Hi, I'm Kengo Ikeuchi
Passionate about machine learning and algorithms —solving complex problems with elegant and efficient code.
About Me

I am currently conducting research in Computer Vision, focusing on Human-Object Interaction (HOI). Specifically, I work on developing novel models that enhance the realism and controllability of HOI generation, with potential applications in AR/VR and robotics. Beyond research, I am passionate about leveraging my expertise in machine learning and algorithm development to create impactful, real-world solutions. My goal is to bridge the gap between cutting-edge research and practical applications, delivering technologically advanced and socially beneficial products to a wide audience. With a background in both theoretical foundations and full-stack development, I am always eager to tackle complex problems and innovate at the intersection of AI and real-world usability.
Download ResumeEducation
Research Focus
一人称視点映像を活用した人間と物体のインタラクション解析に関する研究を行っている。特に手と物体のインタラクションに興味がある。
Research Focus
画像生成拡散モデルにおける著作物を用いた不正な追加学習を検出するため、ノイズ特性に着目した仕組みを構築した。
Experience
Overview
製造業の帳票処理を効率化するため、帳票認識システムのパイプラインを構築した。Detail
本プロジェクトでは、製造業大手企業向けに帳票認識パイプラインを開発。まず、帳票データの分析を行い、認識システムの要件を整理。その後、データの前処理・認識システムの実装・認識結果の可視化まで一連のプロセスを構築した。認識システムは外部AIサービスを活用し、データの一貫性を保つためにPydanticを用いた入力・出力のバリデーションを導入した。Responsibilities
- 帳票データの分析
- 認識システムの設計・実装
- バリデーションの導入
- 認識結果の可視化
Technologies Used
Overview
ヘルプデスク業務の一部自動化を目的とし、RAG (Retrieval-Augmented Generation) を活用した質問応答Webアプリケーションを開発した。Detail
本プロジェクトでは、履歴データを活用し、質問内容に応じて類似する過去の問い合わせ情報を検索、それをLLMに注入することで適切な応答を生成するシステムを構築した。まず、質問・回答履歴を分析し、データの構造を整理。その後、履歴データをデータベース化し、検索・回答生成を行うAPIを実装、最終的にWebアプリケーションとして提供した。Responsibilities
- DB構築・検索システムの実装
- LLM質問応答APIの実装
- UIの設計・開発
Technologies Used
Overview
土木領域における異常検知の効率化を目的とし、データセットの構築と機械学習パイプラインの整備を行った。Detail
本プロジェクトでは、異常検知モデルの精度向上と運用効率化に向け、ベースライン手法の選定、データセットの構築、パイプラインの開発を行った。その中でも特にデータセットの構築に注力し、正例画像の枚数や種類(色味の違いなど)が検知精度に与える影響を詳細に検証しながら、最適なデータセットの作成を模索。また、データセット作成からモデルの訓練・検証(可視化)までをパイプライン化することで、検証スピードの向上に貢献した。Responsibilities
- データ分析
- データセットの構築
- パイプラインの設計・実装
Technologies Used
Projects
AIによる画像生成 x ベクトルDBによる画像検索Webアプリ
Key Features
- Stable Diffusionを用いた画像生成
- Qdrantを用いた画像検索
- Supabaseを用いたDB管理
Technologies Used
SAM2による動画セグメンテーションWebアプリ
Key Features
- SAM2を用いた動画セグメンテーション
- OpenCVを用いたマスク編集
Technologies Used
Skills
Beginner
Less than 6 months
Intermediate
1-2 years
Advanced
3+ years
Publications
Abstract
近年,拡散モデルの追加学習により,望んだ画風の再現が可能となった.一方で,著作物を無断で使用し,その画風を不当に再現するという問題が浮上している.この問題に対し,モデルの応答情報を使用してデータが学習に用いられたかを推論する「メンバーシップ推論」を適用し,データの盗用を検出することが検討されている.本研究では,複数のノイズに対して平均化された応答情報を使用する推論手法を提案し,既存手法と比較して精度が向上することを示す.Abstract
近年,拡散モデルによって高品質で多様な画像の生成が可能になり,さらにモデルを追加学習することで,望んだ画風を再現できるようになった.このように生成の柔軟性が高まる一方,著作物がモデルの学習に無断で使用されてしまい,著作物の画風が第三者の手で不当に再現されるという問題が浮上している.この問題に対し,あるデータがモデルの学習に使用されたか否かを推論する,メンバーシップ推論と呼ばれる手法を適用することで,著作物の保護に貢献できると考えられる.そこで本研究では,LoRAと呼ばれる手法で追加学習された拡散モデルに対して,ノイズの傾向に注目したメンバーシップ推論を実行し,結果の分析を行った.Certifications
Achievements
1400±
AtCoder Rating
Achieved cyan rank in AtCoder competitions
77
TOEFL Score
Reading: 26, Listening: 15, Speaking: 14, Writing: 22