Data Scientist (Gen AI) Tokyo - Job Qualifications:
• 問題解決能力: 複雑な問題をトラブルシューティングするための強力な分析能力。
• コミュニケーション能力: クライアントとの効果的なやり取りや、多様な背景を持つチームメンバーとの協力を可能にする優れた口頭および書面でのコミュニケーションスタイル。
• チームワーク: チーム環境でうまく働き、共同目標に貢献する能力。
• 学歴: 機械学習、人工知能、コンピュータサイエンス、または関連分野の修士号または博士号。AI/ML技術に重点を置いた強力な学術背景が望ましい。
• 追加資格: AI/MLに関連する認定資格を持っていると尚良し。
知識 / 熟練度:
• Python
• TensorFlow
• PyTorch
• Flash Attention
• その他の関連するAI/MLフレームワーク
• オープンソースモデルの経験: 特定のアプリケーションに対してオープンソースモデルを活用し、微調整する能力。
• コミュニティ参加: オープンソースコミュニティへの積極的な参加経験があり、コミュニティリソースの活用と貢献を行っている。
• マルチモーダルデータ: テキスト、画像、音声などのマルチモーダルデータを扱い、これらのデータタイプを統合するモデルを開発する経験。
• エージェンティックAIの開発: 自律的な意思決定やタスク実行が可能なAIシステムの開発知識。
• 日本語能力: ネイティブレベルの日本語とビジネスレベルの英語が必要。
Data Scientist (Gen AI) Tokyo Job Qualifications:
Problem-solving skills with strong analytical ability to troubleshoot complex issues.
Communication skills with excellent verbal and written communication style to effectively engage with clients and collaborate with team members from diverse backgrounds.
Ability to work well in a team environment and contribute to collective goals.
Master’s or PhD in Machine Learning, Artificial Intelligence, Computer Science, or related fields. Strong academic background with a focus on AI/ML technologies preferred.
Additional relevant certifications in AI/ML from recognized institutions are a plus.
Technical skills
Knowledge of / Proficiency in
Python
TensorFlow
PyTorch,
Flash Attention
Other relevant AI/ML frameworks
Experience with Open-Source Models with demonstrated ability to leverage and fine-tune open-source models for specific applications
Community engagement skills with a track record of active participation in the open-source community contributing to and utilizing community resources.
Multi-modal data handling experience in working with multi-modal data (text, image, audio, etc.) and developing models that integrate these data types.
Agentic AI development knowledge of developing AI systems capable of autonomous decision-making and task execution.
Japanese Language: Japanese Native level required and business level english required
内部R&DでのAIシステムの開発と展開:
• クライアントのニーズに合わせたAIおよび生成AIシステムの設計、構築、展開
• オープンソースモデルを活用し、生成AIアプリケーションを作成および微調整
• APACおよびそれ以外のAI COEコミュニティやオープンソースコミュニティと積極的に関わり、最新の進展をプロジェクトに取り入れる
• マルチモーダルデータを扱い、エージェントタスクを実行するAIシステムを開発するための理解と自信を持つこと
クライアント対応:
• クライアントと密に連携し、カスタマイズされたAIソリューションを提供
• 内部または外部の部署から要件を収集し、分析を提供
• 高レベルの設計、データ収集およびクリーニングに参加。データは構造化および非構造化されている可能性がある
• MongoDBなどのNoSQLデータベースやDatabricksなどのデータプラットフォーム、または業界標準のETL技術の知識と経験は大きなプラス
• トランスフォーマーベースのモデルや生成AIモデル、LoRAなどの手法を用いたモデルのファインチューニングの知識と経験があるとプラス
• AIモデルとアプリケーション統合のためのAPI設計およびAIモデルを活用するWebアプリケーション/インターフェースの実装もプラス
データサイエンス:
• データ管理:大規模なデータセットを収集、前処理、および分析して、モデルのトレーニングと評価を行う
• パフォーマンス最適化:AIモデルのパフォーマンスを継続的に監視し、改善
• ドキュメンテーションとレポート:モデル、プロセス、およびプロジェクトの進捗を包括的に文書化し、ステークホルダーに報告書を準備・提出
• Internal R&D to Develop and Deploy AI Systems:
o Design, build, and deploy AI and generative AI systems tailored to client needs.
o Utilize and fine-tune open-source models to create generative AI applications.
o Actively engage with AI COE communities across APAC and beyond, and the open-source community to stay updated on the latest advancements and incorporate them into projects.
o Have an understanding of, and be confident enough to (attempt to) develop AI systems capable of handling multi-modal data and performing agentic tasks.
• Client Work
o Work closely with clients to understand their requirements and deliver customized AI solutions.
o Collect requirements from internal or external departments and provide the analysis.
o Participate in the High-level design and data collection and cleaning. The data can be structured, unstructured.
o Knowledge of and experience with NoSQL DBs like MongoDB and data platforms like databricks and / or with industry standard ETL techniques will be a big plus.
o Knowledege of and experience with transformer based models and generative AI models, including pre-trained large foundation models, fine-tuning of models using techniques like LoRA etc. is a plus.
o Design and implement the API for AI model and applications integration and of Web applications / interfaces that utilize the AI models will also be a plus.
• Data science
o Data Management: Collect, preprocess, and analyze large datasets to train and evaluate models.
o Performance Optimization: Continuously monitor and improve the performance of AI models.
o Documentation and Reporting: Maintain comprehensive documentation of models, processes, and project progress. Prepare and present reports to stakeholders.
Annual salary increase
Bonus once a year
Complete social insurance
Full payment of transportation expenses
Kanto IT Software Health Association
E-learning available
Orientation for new employees
Available for training programs (domestic and overseas)
Fidel Technologies KK (since 2001) is a Tokyo based LangTech Consulting firm & offers Technology - Localization - Bilingual Staffing services & solutions to global as well as SME Japanese clients. For Japan market entry, or IT services (software dev, product dev & implementation, infrastructure support), Localization Services & or Manpower requirements, Fidel is your most trusted Japan based partner.