第316章 好冷
作者:semaphore   离语最新章节     
    weaviate 是一个向量搜索引擎数据库,它专注于连接和管理分散的数据,并通过语义链接来
    解析和查询这些数据。它的主要功能包括语义搜索、数据链接和知识图谱构建。weaviate 的关键
    特性包括机器学习集成,支持多种相似度度量,如欧氏距离和余弦相似度,以及可扩展性。
    weaviate 的主要用途是帮助开发者构建智能应用程序,利用其强大的语义搜索和数据关联功能
    从而实现更智能、更个性化的数据检索和推荐。其特点包括开源、高度可扩展、语义搜索功能强
    大、支持多种数据类型和格式等。这使得 weaviate 在处理大规模复杂数据集时表现出色,特别适
    用于智能问答、搜索引擎和图像识别等领域。
    本章介绍了向量知识库在信息检索和数据管理中的具体优势,随后介绍了向量知识库的构建,
    是提取分割文本,嵌入向量,随后构成向量知识库。给出了 embedding 的原理以及给出了使用
    embedding api 将数据变成向量的代码示意,经过向量化的数据,将其存入 pipecone,后将数据
    库与 weaviate 相连,完成语义搜索、数据链接和知识图谱构建
    术是一种结合了检索和生成机制的深度学习框
    架,用于增强语言模型的性能,尤其适合于构建特定领域的专业大模型。这一技术通过从大规模知
    识库检索相关信息,然后将这些信息融入生成过程中,来生成更准确、更丰富的响应。本节将详细
    阐述如何使用 rag 技术基于通用大模型搭建电力生命周期评估(lca)领域的专业大模型。
    rag 技术核心在于将传统的语言生成模型与信息检索系统结合起来。这种结合不仅使模型能够
    生成语言,还能从大量的文档中检索到具体的事实和数据,从而提供更加精确和详细的生成内容。
    rag 的工作流程大致可以分为以下几步:
    查询生成:根据输入,如一个问题或提示,生成一个查询。
    文档检索:使用生成的查询在知识库中检索相关文档或信息。
    内容融合:将检索到的信息与原始查询融合,形成新的、丰富的输入。
    答案生成:基于融合后的输入,使用语言生成模型生成最终的文本输出。
    先前已经构建好了针对电力 lca 领域的专业大模型,但是缺少检验模型的手段,即缺少模型优
    化环节,本项目设置通过 chatbot 模式,通过与用户进行问答的形式,检验模型是否能调用电力行
    业 lca 领域向量数据库回答该领域专业性问题和时效性问题的有效性。
    chatbot 模式的测试不仅可以验证模型的知识覆盖范围和答案的准确性,还可以评估模型的用
    户交互能力。这种测试模拟真实用户与模型的交互,可以揭示模型在理解和生成回应方面的潜在问
    题。
    测试流程包括以下几个步骤:
    测试设计:根据目标领域定义测试用例,包括典型问题、边缘情况和错误输入。
    下一步设有12人参与预测,将每个人预测的数值进行汇总分别对其求平均 可以得到8.43为中位数的平均数 累计概率为把概率点位平分,每点之间的概率都是12.5% 所以我们可以看到低于或等于8.84的概率是75%
    根据外推预测和差值需要,将函数绘制成平滑曲线,然后我们就可以对其进行估计,可以使用两种方法,点估计和区间估计。
    人们利用已经掌握的知识和手段,预先推知和判断事物未来发展的
    状况的活动。简单的说就是,没发生的事情全是预测,小到预测打
    牌的时候谁出什么,大到学校什么时候,什么时候可以回家,
    预测技术可以分为定性预测和定量预测,而他们又可以基于外部和
    内部的因素。
    定性预测法是基于判断、直觉和经验判断的方法,本质上是主观
    的。这种方法常用于预测一般的业务趋势和大的产品族的长期潜在
    需求。这样定性预测主要用于高层管理。鉴于生产和库存预测通常
    关注的是对某些最终产品的需求,因此定性预测方法很少适用。
    定量预测法是建立在历史或数据基础上的预测,不管这些数据是来
    在本机构内部,还是本机构外部。
    外部预测法是基于与公司产品需求有关的外部指标而进行的预测。
    这类外部指标如房屋开工率、出生率及可支配收入率。外部数据法
    的理论根据是对产品组的需求直接与其他领域的活动成比例或相
    关。
    伴随信息技术的突飞猛进的发展,互联网用户的数量也日益增加,从而促进了电子商务的飞速发展,也给企业带来了机会从而能够更准确地获得消费者数据,大数据技术应运而生。大数据技术被越来越多的企业运用于营销,企业提取各种数据资料,通过对这些数据的整理和分析,用于得到用户的兴趣爱好,消费需求,购买倾向,分析传统营销存在的问题,以期达到更好的营销效果。现代科技的飞速发展给广大人民的生活带来了巨大的变化,消费者越来越强调自我,追求个性,企业在捕捉消费者越来越多样化的需求上面出现了更大的挑战。为了更好地促进企业在大数据背景下能够实现有效地营销,当今社会数字经济蓬勃发展,各行业都紧抓时代机遇转型升级。在家电领域,数智化转型成为家电行业的发展趋势,作为小家电领导品牌之一的,通过二十多年的发展和积累,从一个单一品类家电企业起家,不断改变,调整,超越自己,从而走到了如今小家电的领先地位,坚持的是健康和创新的核心理念。
    这两年,大数据一词越来越为大众所熟知,大数据一直以冷漠的形象出现在大众面前,面对大数据,相信很多人都在雾中。你会发现它其实就在你身边,而且很有趣。下面这两个小故事可以让你体会一下大数据的作用。一个是发生在上个世纪的美国,沃尔玛超市管理人员分析销售数据时发现一个现象:在某些特定的情况下,啤酒和尿布看来没有什么关联的两个物品经常会出现在一个购物篮中,经过持续的调查,发现这种情况多发生在年轻的父亲身上。他们去超市买尿布时,会顺便为自己购买啤酒,这样上述情况就发生了。发现了这个现象后,就开始在卖场中作了一下调整,把啤酒和尿布摆放在一个区域内,让年轻的父亲可以同时并快速找到他们需要的两件商品,超市让这些客户一次购买了两件商品同时获得了更多的销售收入。
    一个消费者一天早上出门在麦当劳吃了早餐,中午在外卖平台点了午饭,晚上到健身房锻炼一小时,和闺蜜一起喝杯奶茶看场电影……移动互联网时代,消费者的这些行为都会以数据的方式沉淀到
    互联网上,无数消费者的行为汇聚在一起,形成人们口中的消费大数据。大数据营销是收集和分析平台数据以获得相关用户的某些特征,然后以?定程度的针对性,精确性和个性化的营销策略。
    明天还冷吗?
    今天早上围巾都找出来了。