一种基于AIGC技术生成商品详情页的方法、系统及装置与流程

xiaoxiao6月前  74

本发明涉及人工智能领域,尤其涉及一种基于aigc技术生成商品详情页的方法、系统及装置。
背景技术
::1、aigc技术,是利用人工智能生成内容的技术,这项技术在各个领域都有广泛的应用,例如生成高质量的文章、图片、音频等,2、多模态大模型,是指可以处理和理解多种模态,如文本、图像、声音等的人工智能模型,它能够更好地理解跨模态的内容,如跨模态检索、语音识别等;3、stablediffusion,是一个基于深度学习的图像生成模型,它可以根据文本描述生成高质量的图片,在电商等领域有着广泛的应用,4、电商商品详情页,是指电商平台上展示商品信息的图片页面,通常包括商品图片、商品参数等内容;5、电商详情页分屏,是电商详情页设计者常用的布局格式,将长页面内容依据一定逻辑划分多个独立部分,每个部分展示不同信息,stablediffusion的抽卡环节,通常是指已配置相关参数后,重复生成图片,选择符合要求图片的过程。6、在现有领域中,虽然有基于多模态大模型或大语言模型生成图片的智能体,但是处理图片依旧难以控制;虽然基于大语言模型生成详情页文案的例子比比皆是,但仍需搭配具有专职性能且可控的aigc图片生成工具;基于stablediffusion生成电商海报的例子也有很多,但在使用stablediffusion时,因为其不稳定性,依然需要“抽卡环节”来选取符合要求的图片;本技术是将上述aigc技术统一集成到所述系统中,使用多模态大模型和stablediffusion协作完成商品详情页的设计和生成,其中,不仅使用多模态大模型设计详情页内容,还对“抽卡”结果进行审查,缓解了商品详情页设计者的“抽卡”压力。技术实现思路1、本技术提供一种基于aigc技术生成商品详情页的方法、系统及装置,使用多模态大模型和stablediffusion协作完成商品详情页的设计和生成,其中,不仅发挥出了其单独作用,更利用多模态大模型审查“抽卡”结果,缓解了商品详情页设计者的“抽卡”压力,发挥出了更优效果。2、技术方案如下,3、一种基于aigc技术生成商品详情页的系统,包括,4、前端操作页面和后端运行模块,5、前端操作页面,6、聊天框,与用户进行自然语言交互、上传图片或/和文本信息,7、预设按键,非功能类背景更换键、功能类背景更换键、艺术字类艺术字修改键、艺术字类艺术字描述修改键、海报类艺术字修改键、海报类艺术字描述修改键、商品图片修改键、功能类主体修改键、模板排版选择预设键、lora选择预设键、内循环次数、外循环次数,8、api地址输入框,前后端通过api进行交互,9、后端运行模块,10、多模态大模型运行模块,以多模态大模型为核心,用于自然语言处理、图片识别和分析,11、工作流执行模块,配置有功能类分屏stablediffusion工作流、商品类分屏stablediffusion工作流、艺术字类分屏stablediffusion工作流、海报类分屏stablediffusion工作流、功能类背景更stablediffusion工作流、主体修改stablediffusion工作流,12、数据管理模块,管理和存储所述系统的各种数据;13、其中,14、聊天框,通过对聊天框中的交互信息使用“@”符号,截取上下文或图片,与聊天框输入信息,一同作为输入prompt工程的输入,与所述系统进行自然语言交互,15、功能类背景更换键,通过所“@”的配图,读取图片元数据,功能类背景更stablediffusion工作流,基于多模态大模型,通过prompt工程,将自然语言输入的背景内容转换成背景提示词,通过功能类背景更stablediffusion工作流,实现更换背景的任务;16、非功能类背景更换键,通过所“@”的配图,读取图片元数据,非功能类背景更stablediffusion工作流,基于多模态大模型,通过prompt工程,将自然语言输入的背景内容转换成背景提示词,替换原有背景提示词,实现更换背景的任务;17、艺术字类艺术字修改键,通过所“@”的配图,读取图片元数据,艺术字类分屏stablediffusion工作流,基于多模态大模型,通过prompt工程,将输入的艺术字内容替换掉原本的艺术字,替换原有背景提示词,实现艺术字修改的任务;18、海报类艺术字修改键,通过所“@”的配图,读取图片元数据,海报类分屏stablediffusion工作流,基于多模态大模型,通过prompt工程,将输入的艺术字内容替换掉原本的艺术字,实现艺术字修改的任务;19、艺术字类艺术字描述修改键,通过所“@”的配图,读取图片元数据,艺术字类分屏stablediffusion工作流,基于多模态大模型,通过prompt工程,将自然语言输入的艺术字描述转换成提示词,替换原有背景提示词,实现更换艺术字风格的任务;20、海报类艺术字描述修改键,通过所“@”的配图,读取图片元数据,海报类分屏stablediffusion工作流,基于多模态大模型,通过prompt工程,将自然语言输入的艺术字描述转换成提示词,替换原有背景提示词,实现更换艺术字风格的任务;21、商品图片修改键,通过所“@”的配图,读取图片元数据,获取海报类分屏stablediffusion工作流或商品类分屏stablediffusion工作流,重新选择所上传的商品图片,生成该配图,实现更换商品的任务;22、功能类主体修改键,调用主体修改stablediffusion工作流,对所“@”的配图进行处理,基于多模态大模型,通过prompt工程,将自然语言输入的想要生成的的主体描述和原图主体描述,输入到主体修改stablediffusion工作流进行处理,生成配图,实现更换主体的任务;23、模板排版选择预设键,预设有排版类型;24、lora选择预设键,所指的是所对应的工作流的可选lora;25、内循环次数,输入内循环循环次数;26、外循环次数,输入外循环循环次数。27、一种基于aigc技术生成电商类广告的方法,28、包括,29、获取数据信息步骤,基于多模态大模型组件,实现自然语言交互能力,获取商品图片、商品信息及卖点信息;30、分析数据信息步骤,多模态大模型组件由prompt工程引导,对商品图片进行分析处理,得到商品图片内的商品描述,根据商品图片内的商品描述、商品信息及卖点信息分析出详情页的主题风格、分屏顺序、分屏类型,依据详情页主题风格、分屏顺序、分屏类型,为其匹配预设的stablediffusion工作流和分屏模板,确认生成详情页方案;其中,31、分屏类型,包含有,32、功能类分屏类型,包含的信息有,功能类分屏描述,33、商品类分屏类型,包含的信息有,商品类分屏描述,34、艺术字类分屏类型,包含的信息有,艺术字类分屏描述,35、海报类分屏类型,包含的信息有,海报类分屏描述;36、分屏描述,包含有,画面描述、分屏配图描述、文本内容或/和艺术字或/和商品图片;37、分屏模板,包含有,功能类分屏模板,对应的像素参数、排版信息;商品类分屏模板,对应的像素参数、排版信息;艺术字类分屏模板,对应的像素参数、排版信息;海报类分屏模板,对应的像素参数、排版信息;38、生成详情页分屏配图步骤,基于多模态大模型组件,通过prompt工程,根据生成详情页方案中的分屏类型分析出所对应的分屏stablediffusion工作流所需的提示词,以此执行所对应的分屏stablediffusion工作流,生成分屏配图;其中,39、功能类分屏类型,配图中不展示商品,而是展示与商品功能或/和广告理念相关的图片,40、与其相对应的预设有,功能类分屏模板、功能类分屏stablediffusion工作流,41、已获取信息,功能类分屏描述,42、生成提示词,主体提示词、背景提示词、风格提示词、预设通用提示词;43、生成功能类分屏配图;44、商品类分屏类型,配图中展示相关商品,45、与其相对应的预设有,商品类分屏模板、商品类分屏stablediffusion工作流,46、已获取信息,商品类分屏描述,47、生成提示词,商品提示词、背景提示词、风格提示词、预设通用提示词;48、生成商品类分屏配图;49、艺术字类分屏类型,配图中不展示商品,而是展示艺术字图片,与其相对应的预设有,艺术字类分屏模板、艺术字类分屏stablediffusion工作流,50、已获取信息,艺术字类分屏描述,51、生成提示词,艺术字描述提示词、背景提示词、风格提示词、预设通用提示词;52、生成艺术字类分屏配图;53、海报类分屏类型,配图中展示艺术字和商品,54、与其相对应的预设有,海报类分屏模板、海报类分屏stablediffusion工作流,55、已获取信息,海报类分屏描述,56、生成提示词,商品提示词、艺术字描述提示词、背景提示词、风格提示词、预设通用提示词;57、生成海报类分屏配图;58、生成详情页步骤,将详情页分屏配图输入外循环进行处理,循环s次,进入内循环处理,循环n次,若依旧不符合标准,则重新设计该详情页分屏,生成详情页;59、其中,60、生成详情页步骤,包含有,外循环、重新设计该详情页分屏处理、生成详情页处理;61、外循环:62、将详情页分屏配图输入内循环进行处理n次,若,符合标准,则,进行生成详情页处理;若,仍不符合,则进入重组提示词生图处理;63、重新设计该详情页分屏处理:64、对分屏配图进行分析排查无效或/和不稳定提示词处理,根据原详情页的分屏信息,不使用提示词储存库中的无效提示词,基于功能类分屏类型重新设计该详情页分屏,并为其匹配对应的工作流,其中,在生成所述重新设计的详情页分屏配图的提示词,若存在不稳定提示词则对不稳定提示词添加增强权重符号;依据重新设计的详情页分屏生成详情页分屏配图;65、生成详情页处理:66、根据所对应的分屏模板中预设的字体样式,将所对应的分屏描述中的文本内容生成对应文本图层,并依据其模板的排版预设,将模板置于图层最底层,将分屏配图置于图层第二层,将文本图层置于最上层,合成详情页分屏,拼接成详情页;67、内循环:基于多模态大模型组件对详情页分屏配图进行特征总结,判定生成详情页方案中的分屏配图描述是否全部表现于详情页分屏配图中,若,是,则,进入外循环生成详情页处理;若,否,则,重新生成该配图,继续进行判定,或进入重新设计该详情页分屏处理,68、重组提示词生图处理,包含有,分析排查无效或/和不稳定提示词、重新生成提示词并生图;69、分析排查无效或/和不稳定提示词:70、基于多模态大模型组件,遍历分屏配图,总结出,共有特征和非共有特征,71、作用于,上述分屏配图共有特征部 分的提示词,判定为有效提示词,72、作用于上,述分屏配图非共有特征部分的提示词,判定为不稳定提示词,73、没有作用于上述分屏配图特征部分的提示词,判定为无效提示词,74、将上述提示词数据储存在提示词储存库中;75、重新生成提示词并生图:76、将提示词与生成详情页方案中的分屏配图描述,进行对比分析,77、基于提示词储存库,不使用无效提示词,重新生成提示词,若存在不稳定提示词则对不稳定提示词添加增强权重符号;替换原有提示词并生成分屏配图;78、提示词储存库:存储有效提示词、无效提示词和不稳定提示词的相关数据库。79、一种基于aigc技术生成商品详情页的装置,包括,80、获取数据信息单元,获取商品图片、商品信息及卖点信息;81、分析数据信息单元,基于多模态大模型组件,处理数据信息,策划,生成详情页方案;82、生成详情页分屏配图单元,基于多模态大模型组件,根据生成详情页方案对数据信息进行处理,利用预设的stablediffusion工作流,生成详情页分屏配图;83、生成详情页单元,将详情页分屏配图输入外循环进行处理,循环s次,进入内循环处理,循环n次,若依旧不符合标准,则重新设计该详情页分屏,生成详情页。84、一种电子设备,包括,处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时,执行如上所述的基于aigc技术生成商品详情页的方法。85、根据本发明的技术方案,产生的有益效果是,86、本技术本技术可以让设计者在一个平台上完成商品详情页的设计和生成的工作,不仅使用多模态大模型策划详情页文案内容,还对“抽卡”结果进行审查,缓解了设计者的“抽卡”压力。当前第1页12当前第1页12
技术特征:

1.一种基于aigc技术生成商品详情页的方法,包括:

2.根据权利要求1所述的一种基于aigc技术生成商品详情页的方法,

3.根据权利要求1所述的一种基于aigc技术生成商品详情页的方法,

4.根据权利要求1所述的一种基于aigc技术生成商品详情页的方法,其特征在于,

5.根据权利要求4所述的一种基于aigc技术生成商品详情页的方法,

6.一种基于aigc技术生成商品详情页的系统,

7.根据权利要求6所述的一种基于aigc技术生成商品详情页的系统,

8.一种基于aigc技术生成商品详情页的装置,包括:

9.一种电子设备,包括:处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时,执行上述权利要求1至5任意一项所述的基于aigc技术生成商品详情页的方法。


技术总结
本申请公开一种基于AIGC技术生成商品详情页的方法、系统及装置,属人工智能领域,包括:获取数据信息步骤:获取商品图片、商品信息及卖点信息;分析数据信息步骤:基于多模态大模型组件,处理数据信息,策划,生成详情页方案;生成详情页分屏配图步骤:基于多模态大模型组件,根据生成详情页方案对数据信息进行处理,利用预设的Stable Diffusion工作流,生成详情页分屏配图;生成详情页步骤:将详情页分屏配图输入外循环进行处理,循环S次,进入内循环处理,循环N次,若依旧不符合标准,则重新设计该详情页分屏,生成详情页;所述,加强了多模态大模型与Stable Diffusion的协作关系,更利用了多模态大模型审查详情页配图,辅助设计者完成详情页。

技术研发人员:宋岩
受保护的技术使用者:宋岩
技术研发日:
技术公布日:2024/9/23

最新回复(0)