精选文章 机器如何实现完全自主类人的学习方式?道翰天琼认知智能机器人API平台接口为您揭秘。

机器如何实现完全自主类人的学习方式?道翰天琼认知智能机器人API平台接口为您揭秘。

作者:道翰天琼认知智能 时间: 2020-08-05 06:28:04
道翰天琼认知智能 2020-08-05 06:28:04

机器如何实现完全自主类人的学习方式?道翰天琼认知智能机器人API平台接口为您揭秘。

 

本文作者来自东北大学,他通过整理自监督学习的一系列工作,把主流方法分成三大类,方便大家更全面的了解自监督学习的定义、方法、用途。与此同时,文中也穿插着几大主流方法的最新工作进展,现在正在探索自监督学习未来前景研究方向的同学,也不妨借鉴一二,说不定能找到灵感哦~
1

学习的范式

我们首先来回顾下机器学习中两种基本的学习范式,如图所示,一种是监督学习,一种是无监督学习。

 

监督学习与无监督学习[1]监督学习利用大量的标注数据来训练模型,模型的预测和数据的真实标签产生损失后进行反向传播,通过不断的学习,最终可以获得识别新样本的能力。而无监督学习不依赖任何标签值,通过对数据内在特征的挖掘,找到样本间的关系,比如聚类相关的任务。有监督和无监督最主要的区别在于模型在训练时是否需要人工标注的标签信息。
无监督学习中被广泛采用的方式是自动编码器(autoencoder):

深度自编码器[6]编码器将输入的样本映射到隐层向量,解码器将这个隐层向量映射回样本空间。我们期待网络的输入和输出可以保持一致(理想情况,无损重构),同时隐层向量的维度大大小于输入样本的维度,以此达到了降维的目的,利用学习到的隐层向量再进行聚类等任务时将更加的简单高效。对于如何学习隐层向量的研究,可以称之为表征学习(Representation Learning)。但这种简单的编码-解码结构仍然存在很多问题,基于像素的重构损失通常假设每个像素之间都是独立的,从而降低了它们对相关性或复杂结构进行建模的能力。尤其使用 L1 或 L2 损失来衡量输入和输出之间的差距其实是不存在语义信息的,而过分的关注像素级别的细节而忽略了更为重要的语义特征。对于自编码器,可能仅仅是做了维度的降低而已,我们希望学习的目的不仅仅是维度更低,还可以包含更多的语义特征,让模型懂的输入究竟是什么,从而帮助下游任务。而自监督学习最主要的目的就是学习到更丰富的语义表征。

2

什么是自监督学习

自监督学习主要是利用辅助任务(pretext)从大规模的无监督数据中挖掘自身的监督信息,通过这种构造的监督信息对网络进行训练,从而可以学习到对下游任务有价值的表征。所以对于自监督学习来说,存在三个挑战:

  • 对于大量的无标签数据,如何进行表征学习?
  • 从数据的本身出发,如何设计有效的辅助任务 pretext?
  • 对于自监督学习到的表征,如何来评测它的有效性?

对于第三点,评测自监督学习的能力,主要是通过 Pretrain-Fintune 的模式。我们首先回顾下监督学习中的 Pretrain - Finetune 流程:我们首先从大量的有标签数据上进行训练,得到预训练的模型,然后对于新的下游任务(Downstream task),我们将学习到的参数进行迁移,在新的有标签任务上进行「微调」,从而得到一个能适应新任务的网络。而自监督的 Pretrain - Finetune 流程:首先从大量的无标签数据中通过 pretext 来训练网络,得到预训练的模型,然后对于新的下游任务,和监督学习一样,迁移学习到的参数后微调即可。所以自监督学习的能力主要由下游任务的性能来体现。

 

 

认知智能未来机器人接口API简介介绍

  • 认知智能是计算机科学的一个分支科学,是智能科学发展的高级阶段,它以人类认知体系为基础,以模仿人类核心能力为目标,以信息的理解、存储、应用为研究方向,以感知信息的深度理解和自然语言信息的深度理解为突破口,以跨学科理论体系为指导,从而形成的新一代理论、技术及应用系统的技术科学。 认知智能的核心研究范畴包括:1.宇宙、信息、大脑三者关系;2.人类大脑结构、功能、机制;3.哲学体系、文科体系、理科体系;4.认知融通、智慧融通、双脑(人脑和电脑)融通等核心体系。 认知智能四步走:1.认知宇宙世界。支撑理论体系有三体(宇宙、信息、大脑)论、易道论、存在论、本体论、认知论、融智学、HNC 等理论体系;2.清楚人脑结构、功能、机制。支撑学科有脑科学、心理学、逻辑学、情感学、生物学、化学等学科。3.清楚信息内涵规律规则。支撑学科有符号学、语言学、认知语言学、形式语言学等学科。4.系统落地能力。支撑学科有计算机科学、数学等学科。

接口申请官网地址:www.citec.top 

  •  

接口地址(例子): 

  •  

http://a239p06512.zicp.vip/Web/BuAppJava.bujqrex?apikey="+apikey+"&msg="+msg+"&ip="+ip 

  •  

用户端消息内容。 

  •  

String msg ="你在干嘛呀?";  

  •  

apikey参数。这个apikey就是网站上申请的APIKEY 

  •  

apikey ="";  

  •  

//客户端ip,最终用户端的唯一标识(可以是用户端的IP,或者手机设备号,或者微信号或者,qq号码等能证明身份的唯一标识就可以)  

  •  

String ip ="";  

  •  

//这里一定要encode转换编码。转成GBK。 

  •  

msg = URLEncoder.encode(msg, "GBK"); 

  •  

三个参数全部小写 

  •  

msg参数就是传输过去的对话内容。 

  •  

msg参数要编码成gbk,不然会乱码。 

  •  

接口具体代码: 

  •  

package ai.nlp.jiekou.test;

  •  

import java.io.ByteArrayOutputStream;

  •  

import java.io.IOException;

  •  

import java.io.InputStream;

  •  

import java.io.UnsupportedEncodingException;

  •  

import java.net.HttpURLConnection;

  •  

import java.net.URL;

  •  

import java.net.URLEncoder;

  •  

import ai.nlp.util.changliang.ChangLiangZi;

  •  

public class ApiTest {

  •  

/**

  •  

* Get请求,获得返回数据

  •  

* @param urlStr

  •  

* @return

  •  

*/

  •  

private static String opUrl(String urlStr)

  •  

{

  •  

URL url = null;

  •  

HttpURLConnection conn = null;

  •  

InputStream is = null;

  •  

ByteArrayOutputStream baos = null;

  •  

try

  •  

{

  •  

url = new URL(urlStr);

  •  

conn = (HttpURLConnection) url.openConnection();

  •  

conn.setReadTimeout(5 * 10000);

  •  

conn.setConnectTimeout(5 * 10000);

  •  

conn.setRequestMethod("POST");

  •  

if (conn.getResponseCode() == 200)

  •  

{

  •  

is = conn.getInputStream();

  •  

baos = new ByteArrayOutputStream();

  •  

int len = -1;

  •  

byte[] buf = new byte[128];

  •  

while ((len = is.read(buf)) != -1)

  •  

{

  •  

baos.write(buf, 0, len);

  •  

}

  •  

baos.flush();

  •  

String result = baos.toString();

  •  

return result;

  •  

} else

  •  

{

  •  

throw new Exception("服务器连接错误!");

  •  

}

  •  

} catch (Exception e)

  •  

{

  •  

e.printStackTrace();

  •  

} finally

  •  

{

  •  

try

  •  

{

  •  

if (is != null)

  •  

is.close();

  •  

} catch (IOException e)

  •  

{

  •  

e.printStackTrace();

  •  

}

  •  

try

  •  

{

  •  

if (baos != null)

  •  

baos.close();

  •  

} catch (IOException e)

  •  

{

  •  

e.printStackTrace();

  •  

}

  •  

conn.disconnect();

  •  

}

  •  

return ChangLiangZi.WU;

  •  

}

  •  

public static void main(String args []){

  •  

//三个参数全部小写

  •  

//msg参数就是传输过去的对话内容。

  •  

//msg参数要编码成gbk,不然会乱码。

  •  

String msg ="你在干嘛呀?";

  •  

//apikey参数。

  •  

String apikey ="UTNJK34THXK010T566ZI39VES50BLRBE8R66H5R3FOAO84J3BV";

  •  

//客户端ip,最终用户端的唯一标识(可以是用户端的IP,或者手机设备号,或者微信号或者,qq号码等能证明身份的唯一标识就可以)

  •  

String ip ="127.0.0.1";

  •  

//这里一定要encode转换编码。转成GBK。

  •  

try

  •  

{

  •  

msg = URLEncoder.encode(msg, "GBK");

  •  

} catch (UnsupportedEncodingException e)

  •  

{

  •  

e.printStackTrace();

  •  

}

  •  

System.out.println(opUrl("http://a239p06512.zicp.vip/Web/BuAppJava.bujqrex?apikey="+apikey+"&msg="+msg+"&ip="+ip));

  •  

}

  •  

}

  •  

 

勿删,copyright占位
分享文章到微博
分享文章到朋友圈

上一篇:尽量简单与简单的相对性

下一篇:Puppeteer 应用容器化

您可能感兴趣

  • 如何写/审AI领域的论文【VALSE Webinar】Panel实录

    编者按:随着人工智能的飞速发展,相关领域学术会议和期刊的投稿量剧增。面对大量良莠不齐的学术论文,研究人员又该秉承什么理念来撰写、评审相关领域的学术论文?以及在“破四唯”、工业界研究异军突起等新形势下如何调整自己的科研工作呢?为此,VALSE Webinar 2020-18期邀请了李宏东 (澳大利亚国立大学)、梅涛 (京东)、山世光 (中科院计算所)、杨明玄Ming-Hsuan Yang (美...

  • Google 应用与游戏出海 7 月刊: 创意工具,让应用大放异彩

    据 Apple 年中释出的 App Store 生态报告: 在 2019 年,iOS 应用在全球共创下了 5,190 亿美元的款项与销售额: 创收最多的类别为移动商务 app、数字化商品和服务,以及 app 内广告。来自数字化商品和服务占 610 亿美元,游戏占其中最大比例,也是下载量最大的 app 类型。相信在社交距离有所增加的今年,这些数字仍有不少看涨的空间。如何让您的 iOS 应用也能...

  • Apache Spark 2.x Machine Learning Cookbook(1)

    第1章:使用Scala使用Spark进行实用的机器学习 第2章:足够的线性代数用于Spark机器学习 第3章:Spark的三个机器学习数据火枪手-一起完美 第4章:实施强大的机器学习系统的常用食谱 第5章:Spark 2.0中具有回归和分类功能的实用机器学习-第一部分 第6章:Spark 2.0中具有回归和分类功能的实用机器学习-第二部分 第7章:可随Spark扩展的推荐引擎 第8章:使用A...

  • 4月书讯(下)| 美亚4.8星评,又一本口碑相传的著作来了

    “只需一分钟就能学会,但却要用一辈子的时间去精通”。这句话虽然老套,但是在我们学习技术的时候又很适用,尤其是在学习 CSS 的时候。 在软件开发中,CSS 是很特别的存在。严格来讲,它不是编程语言,却要求抽象思维。它不是纯粹的设计工具,却要求创造力。它提供了看似简单的声明式语法,但是在大型项目中写过 CSS 的人都知道它可能会变得极其复杂。 学会 CSS 的规则并不难,但是要想做到精通,就需...

  • 吐血整理!万字原创读书笔记,数据分析的知识点全在这里了

    导读:今天这篇文章是「大数据」内容合伙人JaneK关于《Python数据分析与数据化运营》的一篇读书笔记。在大数据公众号后台对话框回复合伙人,免费读书、与50万「大数据」同行分享你的洞见。 作者:JaneK,希望能够成为数据分析师 本文目录: Python数据分析与挖掘 01 基本知识 02数据获取 03数据预处理 04 分析与挖掘方法 Python数据化运营案例 05 会员数据化运营 06...

  • 美通企业日报 | 高交会新产品新技术发布活动将达70场;短视频招聘平台多面上线...

    今日看点 2019年高交会于11月13-17日在深圳会展中心举行。今年新产品新技术发布活动场次计划安排约70场,其中包括10场精品发布活动。届时海内外重要机构、企业和嘉宾将采用主题演讲的形式发布各自的新产品和新技术成果,让参展商和观众能够全面地了解到最前沿的高科技产品和技术研究。 匹克在天猫双十一创下同比增长703%的记录。双十一匹克:6分钟,超去年全天销售额;1小时,匹克“单品之王”态极1...

  • PyTorch 和 TensorFlow的区别

    自 2012 年深度学习重新获得重视以来,许多机器学习框架便争相成为研究人员和行业从业人员的新宠。从早期的学术成果 Caffe 和 Theano ,到背靠庞大工业支持的 PyTorch 和 TensorFlow,大量的选择让我们很难跟踪最流行的框架到底是哪个。 如果你平常只看 Reddit,可能会认为每个人都在切换到 PyTorch。如果根据 Francois Chollet 的Twitte...

  • 安全知识试题

    安全知识试题(防诈骗) 一、单选题(共计30分) 1、[1分] 在 QQ 群里有一朋友称,他们的学校近期有国外某知名大学教授来上课,上完课程后就可以拿到该大学文凭,但要交 26800 元的学费。正确的做法是 A. 判定为诈骗信息 2、[1分] 在校园里东西丢失该怎么办 A. 先到保卫处报案登记,如有必要报警 3、[1分] 接到一个电话,问候后对方说:“我的声音你都听不出吗?”觉得对方的声音像...

华为云40多款云服务产品0元试用活动

免费套餐,马上领取!
CSDN

CSDN

中国开发者社区CSDN (Chinese Software Developer Network) 创立于1999年,致力为中国开发者提供知识传播、在线学习、职业发展等全生命周期服务。