Sudy / すでぃー (@sudy_super)

About Me

  • 本名: 須田楽大
  • 年齢: 18歳
  • 性別: 男

Research Interests

  • NLP
  • Speed-up Runtime
  • Reduce Memory Footprint

Career

  1. 2025-04 筑波大学 入学

    情報学群情報科学類

  2. 2025-03 早稲田高等学校 卒業

  3. 2022-03 早稲田中学校 卒業

Achievements

2024年度 (高3)

  • 未踏ジュニア2024 採択

2023年度 (高2)

  • LOCAL AI HACKATHON #000 銅賞

2022年度 (高1)

  • 缶サット甲子園 2022 全国大会出場

Skills

Programming Languages

  • Python
  • C++

Tools & Frameworks

  • PyTorch
  • Docker
  • Azure

Experiences

  • LLMの事前学習、Fine-tuning、プロンプトエンジニアリング、RAGの開発
  • LLMの事前学習・Fine-tuning向けデータセットの構築、収集
    • C++を用いた各種クリーニングによる数億件 (200b tokens)規模の高品質なテキストコーパスの構築経験
    • 人力・自動生成による高品質なFine-tuning用データセットの作成
  • GPUノード間の通信最適化
    • 大規模分散学習時の通信オーバーヘッド低減
    • 通信高速化に関するエラー解決の知見あり
  • LLMの分散学習
    • Megatron-LM, gpt-neoxなどのフレームワークの大半のコードを理解
    • 開発環境・モデルに応じた柔軟な改造が可能
  • PyTorchを用いたオリジナルアーキテクチャモデルの構築
  • その他機械学習の基本的な知識

Activities

Products

Malum-230 (2025-01-06)

手作業で作成した高品質な事前学習・事後学習両用の論理推論データセット。
oasst2という一般的な対話データセットを用いた実験において、大規模言語モデル「Qwen2.5-7B」に対しMalumの追加の有無で比較学習を行い、論理的推論 (Reasoning)タスクの性能向上を実証。

Piece-of-Refined-OSCAR (2024-04-07)

LLMの事前学習のテスト向けに160万件 (0.5b tokens)程度の小規模な日本語コーパスを構築。

Pret-a-Porter (2024-04-01)

日本語Instruction-tuning/RLHFデータセット生成を目的として、既存データセットの高品質化および指示生成モデルと応答生成モデルの作成を行ったプロジェクト。
LOCAL AI HACKATHON #000にて銅賞を受賞。
既存データセットの高品質化と一部の学習コードの実装を担当。

JetCopper-10B (2024-03-22)

LLMの事前学習のテスト用に1600万件 (10b tokens)程度の小規模な日本語・英語・コード混合のコーパスを構築。

MoEモデルの事前学習に最適化した学習フレームワーク

NDAにより非公開。

Baku (2024-01-09)

大規模言語モデル「CALM2-7b」の同じ層を再利用することによりパラメータを増やしたモデル。

  • 1~24層、8~32層をslerpマージしたbaku-10b
  • 1~16層x1、8~24層x2、16~32層x1をpassthroughマージしたbaku-13b
  • 同構成でslerpマージしたbaku-13b-v2
を作成。

Sentinel (2023-11-15)

多言語対応のプロンプトインジェクション判定器。
原理的にハックされることがないため、対話モデルの前段に配置することで既存LLMのプロンプトを操作する事に比べて効果的にプロンプトインジェクションやジェイルブレイクを防止可能。
Meta社のLlama Guardの45倍小規模なため低レイテンシで動作する。

AutoMATA (2023-09-06)

LLMに能動的推論機能と疑似意識を実装するツール。
人間に近い思考を再現することで素のLLMより高い問題解決・対話能力を発揮可能。

CoTangent (2023-07-04)

手作業で作成した高品質な100件の日本語CoT (Chain of Thought) データセット。

SudyIndex (2023-06-14)

AITuber等のAIキャラクターに特化した記憶・想起システム。

Blog

Intern / Part-time

Machine Learning Engineer @ ReAlice Inc.
August 2023 - January 2024

Backend Engineer @ Pictoria Inc.
July 2023 - September 2023

Social

Contact