zealotlab
本站致力于IT相关技术的分享
构建基于Crossplane和Rails控制平面的生成式AI声明式训练平台 构建基于Crossplane和Rails控制平面的生成式AI声明式训练平台
我们面临的根本挑战并非如何微调一个生成式AI模型,而是如何系统性地、可重复地、规模化地管理成百上千次模型微调实验的完整生命周期。每个实验都需要昂贵的、短暂的GPU资源、精确版本化的数据集,以及一个隔离的、干净的执行环境。当团队规模扩大,实验
2023-11-20
基于BentoML、Iceberg与SSG构建不可变机器学习模型评估报告流水线 基于BentoML、Iceberg与SSG构建不可变机器学习模型评估报告流水线
团队的模型性能追踪一度陷入混乱。评估指标散落在不同的Jupyter Notebook输出、CSV文件和临时的监控图表中。当需要回溯三个月前某个特定模型版本(比如 v0.7.1)为何在特定数据切片上表现优于当前版本(v1.2.0)时,整个过程
2023-10-27
使用Ansible自动化部署基于ScyllaDB实时特征存储的Keras生成式AI推理服务 使用Ansible自动化部署基于ScyllaDB实时特征存储的Keras生成式AI推理服务
我们的新一代个性化内容生成服务在原型阶段表现惊人,但部署到准生产环境后,推理延迟的P99指标直接飙升到了无法接受的3秒。问题根源很快被定位:模型需要实时获取用户最新的行为特征作为Prompt的一部分,而我们现有的特征平台是基于Hadoop/
2023-10-27