如果局限于大模型,那双非的算法不是10%,应该是0.1%。infra也不会多。 目前真正涉及训练的,只有大厂