cdb

阅读 / 问答 / 标签

CBC BOC ABC ICBC CMSB CMBC CDB CIB HSBC

CCB中国建设银行China Construction BankBOC中国银行Bank of ChinaABC中国农业银行Agricultural Bank of ChinaICBC中国工商银行Industrial and Commercial Bank of ChinaCMSB中国民生银行China Minsheng BankCMBC中国民生银行China Minsheng Banking Corp.ltdCDB国家开发银行 CHINA DEVELOPMENT BANKCIB中国兴业银行China Industrial BankHSBC汇丰银行HSBC (the Hong Kong and Shang Hai Banking Corporation)第一个是CBC吗?确定吗?

VB Val和CDbl的区别

都是类型转换,转换成数值类型VAL是根据情况来系统自动决定转换成什么类型,CDbl是转换成双精度浮点数据类型VB中C带头的强制转换函数有:CBool(expression) ---- 转换成布尔型CByte(expression) ---- 转换成字节型CCur(expression) ---- 转换小数尔型CDate(expression) ---- 转换成日期型CDbl(expression) ---- 转换成双精度型CDec(expression) ---- 转换成无小数型CInt(expression) ---- 转换成整型CLng(expression) ---- 转换成长整型CSng(expression) ---- 转换成单精度型CStr(expression) ---- 转换成字符型CVar(expression) ---- 转换成变体型建议,安装VB时,安装MSDN,可以得到帮助说明

VB Val和CDbl的区别

都是类型转换,转换成数值类型VAL是根据情况来系统自动决定转换成什么类型,CDbl是转换成双精度浮点数据类型VB中C带头的强制转换函数有:CBool(expression)----转换成布尔型CByte(expression)----转换成字节型CCur(expression)----转换小数尔型CDate(expression)----转换成日期型CDbl(expression)----转换成双精度型CDec(expression)----转换成无小数型CInt(expression)----转换成整型CLng(expression)----转换成长整型CSng(expression)----转换成单精度型CStr(expression)----转换成字符型CVar(expression)----转换成变体型建议,安装VB时,安装MSDN,可以得到帮助说明

断路器CDBKs什么意思?

你好很高兴回答你的问题德力西CDBKs是小型标准断路器CDBKs是型号标志希望能帮到你谢谢

打开jdscdb数据库的SQL命令是:

mysql-h数据库地址-uroot-p密码;sqlplussys/passwordassysdba这个是作为管理员登陆sqlplususername/password这个是普通账户登录数据库是“按照数据结构来组织、存储和管理数据的仓库”。是一个长期存储在计算机内的、有组织的、可共享的、统一管理的大量数据的集合。

手机照片为啥到电脑上是cdb图像

你可以尝试改下后缀名 或者下载个查看CDB格式图片的软件!

在电脑上怎么打开医保cdb文件

模板文件用EDITPLUS、UEDIT打开

求助:电气图中CDB7

CDB应该是断路器,不过具体需要结合图纸看。

迅达电梯的cdb安装平台是什么

迅达电梯从2017年开发了世界上第一个电梯机器人安装系统 (RISE),这个机器人会自行推动车轮上的轴,钻出精密孔以设置电梯导轨和层门所需的地脚螺栓。它从建筑物的数字模型中读取数据,并扫描表面以找到正确的位置。

游戏王ygocorecdb文件怎么打开

cdb是卡片数据库文件,一般不需要打开。如果需要制作diy卡,可以用DataeditorX来打开。

excel如何将abcd变为cdb

直接替换啊

这个配电箱上的CDB5-100 32A和CDB3LE-40 C20是什么意思啊

cdb3le-40为品牌和型号,c20代表承受电流

CDB文件问题

这个cdb文件就是编码呀。不是汉字来的。。。。呵呵

国家开发银行http://www.csls.cdb.com.cn/生源地学生助学贷款系统为什莫存在安全认证错误,能用不???

是不是要先安装安全证书?

cdb格式的数据库是什么数据库?我想要写个软件去编辑这个数据库。有没有软件能够将其转换成mdb?

.cdb文件其实就是ANSYS的命令流文件,其中包含了生成相应ANSYS模型的所有命令流。用ACCESS导入试试看

vb中 cdb1是什么意思

应该是CDbl才对吧?(是字母L的小写,不是数字1)CDbl 是把数字表达式的结果转换为双精度浮点数(Double),其中C是Convert,即转换的意思Dbl是Double,即双精度浮点数的意思所以CDbl就是转换为双精度浮点数的意思!

自动出现cdb文件

这是汽车自动驾驶上的一种故障乱码。需要用专用解码仪或者更换另一个系统进入读取正确的故障码。根据正确的故障码解决程序输入系统以后,排除掉故障乱码以后即可消除。

PDK文件的CDB版本和OA版本的区别

小弟有个问题向请教一下大神,同一个Foundry同一工艺的PDK文件的CDB版和OA版有什么区别?CDB版适用于IC5141,OA版适用于IC61。如果Foundry厂只提供CDB版的,而我的Cadence是IC61版的,我该怎么办啊?如果我将CDB版用cdb2oa转换成OA版会不会出现什么问题,比如说数据丢失,仿真出故障,版图显示不了啊等等?还有就是对我的电路设计以及tape out会不会有影响?如果Foundry厂提供的CDB版的PDK更新的话又有什么影响?请求大神赐教!非常感谢!

SCDB数据库是什么?

SCDB属于一种新的数据库包

ansys如何导入cdb

在前处理中,有个ACHIVE model,里面有个write和read,点read里面就有导入CDB文件。另一种,在标题栏中fail,里面有read input from也可以打开cdb

后缀为_6.CDB的文件怎么打开?

模板文件~~:)后缀无所谓的。。。可以用EDITPLUS、UEDIT等打开编辑的

房产中cdb是什么意思

Central Business District 商务中心

fortran读取cdb文件

可以选择读取。在Fortran程序中使用文件,fortran可以选择读取为cdb文件。FORTRAN语言是FormulaTranslation的缩写,意为“公式翻译”。

影之诗cdb是什么

是游戏。影之诗cdb是游戏,CDB版本无限杯国际服已经开始了,国服也即将上线。影之诗是由日本Cygames公司开发的一款日式幻想题材卡牌对战游戏。

空调机主能力测试条件是什么?还有CDB,CWB.

CDB意思是环境干球温度,CWB是环境湿球温度,一般测定空调的制冷能力的标准环境温度是:室内27/19室外35/24,这就定了环境的温度和湿度.而制热的环境标准温度是:20/15,7/6

cdb.exe系统错误

网络的问题。cdb.exe系统错误多数是网络连接异常导致。1、首先打开电脑检查网络。2、其次打开系统进行测试网络连接是否异常。3、最后点击系统重新进入即可。

空调机主能力测试条件是什么?还有CDB,CWB.

CDB意思是环境干球温度,CWB是环境湿球温度,一般测定空调的制冷能力的标准环境温度是:室内27/19室外35/24,这就定了环境的温度和湿度.而制热的环境标准温度是:20/15,7/6

抖音上的cdb是什么意思

cdb是城市综合体。城市综合体是以建筑群为基础,融合商业零售、商务办公、酒店餐饮、公寓住宅、综合娱乐五大核心功能于一体的“城中之城”。但是随着时代的进步,越来越多源于城市综合体运作模式的综合体建筑不断演化出来,它们的功能比狭义意义上的城市综合体少,根据不同功能的侧重有不同的称号,但是可以都属于城市综合体。

社保的cdb是什么文件,怎样打开

模板文件用EDITPLUS、UEDIT打开一般现在都是网上作人员增减和申报,在导入一项中直接点击该cdb文件,就能显示在社保网站上,无需直接点击查看。

写字楼简称cdb吗

是的其实就是在中心商务区的写字楼,是一个修饰词

cdb是什么意思的缩写?

cdb指国家开发银行。国家开发银行是中央金融企业,成立于1994年,是直属国务院领导的政策性银行。2008年12月改制为国家开发银行股份有限公司。2015年3月,国务院明确国开行定位为开发性金融机构。相关信息:国开行是全球最大的开发性金融机构,中国最大的对外投融资合作银行、中长期信贷银行和债券银行。2015年,在美国《财富》杂志世界企业500强中排名第87位。 2019年7月,发布2019《财富》世界500强:国家开发银行排名67位。2019年9月1日,2019中国服务业企业500强榜单在济南发布,国家开发银行股份有限公司排名第9位。“一带一路”中国企业100强榜单排名第73位。2019年12月,国家开发银行入选2019中国品牌强国盛典榜样100品牌。

同学老说我CDB啥意思啊?

chidabian

cdb姓名验证失败

题主是否想询问“cdb姓名验证失败怎么办”?1、首先打开CDB即CommonDataBase(公用数据库)。2、其次点击登录,选择手机号码进行登录,输入个人的信息后点击确定。3、最后就能解决姓名验证失败的问题,换一个方式登录就行。

什么叫CDB商圈,请教大家了!

不是CDB,是CBD,呵呵。中央商务区(Central Business District,简称:CBD)指一个国家或大城市里主要商业活动进行的地区。其概念最早产生于1923年的美国,当时定义为“商业会聚之处”。随后,CBD的内容不断发展丰富,成为一个城市、一个区域乃至一个国家的经济发展中枢。 一般而言,CBD高度集中了城市的经济、科技和文化力量,作为城市的核心,应具备金融、贸易、服务、展览、咨询等多种功能,并配以完善的市政交通与通讯条件。世界上比较出名的城市CBD有纽约曼哈顿、伦敦金融城、巴黎拉德方斯、东京新宿、香港中环等等。

.cdb 文件应该怎样打开?拜托各位大神

使用PowerDesigner 软件可以打开。

万达cdb什么意思

你是想说cbd吧,万达CBD就是万达商务区的意思CBD:商务中心区 (一般指写字楼比较多的地方) 全称Central Business District (业务中心地区)意思就是说核心商务区,现在各个城市都在建,每个城市都有CBD ,所在区域应该说房子升值潜力比较大,有较高的发展空间。一般这里的房子,都比较抢手。

CDB:内存1000g硬盘25g 是什么意思?

内存作为系统为CPU(处理器)提供高速待处理文件,以及临时存储已处理文件作用,其内存频率则是影响电脑速度问题之一;内存为CPU提供处理以及临时存储数据,因此内存通为【高速缓存条】,无法永久存储任何文件与资料。硬盘作为电脑存储硬件,其中,电脑系统存储位置也在硬盘某盘符当中,硬盘特点:能永久存储文件,可读可写、容量大、存储电脑所有系统、程序、文件等;根据简易两者硬件介绍以下区别如下:硬盘容量>内存容量硬盘读取频率与速度<内存读取频率与速度硬盘可永久存储用户数据;内存为临时存储数据,无法永久储存硬盘以大容量存储硬件在计算机当中,提供资源给予内存,再由内存给予CPU处理,且会同时接收CPU处理完成的数据发送至各个归属硬件。因此,两者均为不可缺少的重要硬件系统之一,区别如上描述。

农村CDB是什么意思

农村cbd的意思是在农村,一群人在一起闲聊,拉家常,聊家长里短,聊村里的大小事情。CBD也称中央商务区,是指一个国家或大城市里主要商务活动进行的地区,其概念最早产生于1923年的美国。一般而言,CBD位于城市中心,作为城市的核心,应具备服务、展览、金融、贸易、咨询等多种功能,并配以完善的市政交通与通讯条件

adpl怎么打开cdb

1、该文件可用记事本打开进行编辑,在文件上右击,选择打开方式,用记事本打开即可,打开内容为该求解器格式编写的求解文件。2、接下来可通过求解器软件打开,通过开始菜单找到启动器,为该软件所在路径,找到后启动第一项。3、打开启动器后,方框中可以设置要启动的模块,设置完成,点击run即可启动此求解器。4、如果有命令符弹窗提示,输入y并会车确定,即可启动软件,使用软件打开cdb格式文件,可以使用用户交互界面编辑,更直观。5、启动软件后,点击file菜单,选择其下方readinputform读入cdb格式文件,这样可以将求解文件导入求解器中。6、此时会弹出文件选择对话框,从中选择盘符后,在对应文件夹下找到所需文件,确定即可导入。7、导入求解文件后,图形窗口可能并没有变化,通过plot菜单下elements即可显示有限元模型的单元,如何导入打开cdb文件,介绍完成。

北京CDB是什么呀?

center business department中心商务区

ansys无法打开cdb文件

ansys有两种方法可以打开cdb文件。根据查询相关公开信息显示:1、在前处理中,有个ACHIVEmodel,里面有个write和read,点read里面就有导入CDB文件。2、另一种,在标题栏中fail,里面有readinputfrom也可以打开cdb。

.cdb是什么文件?

模板文件用EDITPLUS、UEDIT打开

为什么把国家开发银行(CDB)称为察道集团?

国家开发银行China Development Bank取第一个字母,得 CDB然后察道集团 (CDB lnc.) 然后两个就可以愉快的在一起了察道的拼音cha dao,取第一个字母就是CD

空调机主能力测试条件是什么?要详细点.....还有CDB,CWB。是什么意思?

CDB意思是环境干球温度,CWB是环境湿球温度,一般测定空调的制冷能力的标准环境温度是:室内27/19室外35/24,这就定了环境的温度和湿度。而制热的环境标准温度是:20/15,7/6

抖音cdb是什么意思

城市综合体。城市综合体是以建筑群为基础,融合商业零售、商务办公、酒店餐饮、公寓住宅、综合娱乐五大核心功能于一体的“城中之城”。但是随着时代的进步,越来越多源于城市综合体运作模式的综合体建筑不断演化出来,它们的功能比狭义意义上的城市综合体少,根据不同功能的侧重有不同的称号,但是可以都属于城市综合体。

oracle pdb和cdb的区别

Oracle 12C引入了CDB与PDB的新特性,在ORACLE 12C数据库引入的多租用户环境(Multitenant Environment)中,允许一个数据库容器(CDB)承载多个可插拔数据库(PDB)。CDB全称为Container Database,中文翻译为数据库容器,PDB全称为Pluggable Database,即可插拔数据库。在ORACLE 12C之前,实例与数据库是一对一或多对一关系(RAC):即一个实例只能与一个数据库相关联,数据库可以被多个实例所加载。而实例与数据库不可能是一对多的关系。当进入ORACLE 12C后,实例与数据库可以是一对多的关系。

空气开关cdb代表什么

你好,CDB是德力西断路器, CDB系列小型断路器(以下简称断路器)适用于交流50Hz/60Hz,额定电压230V/400V,额定电流至125A的电路中,作为线路过载和短路保护之用,也可适用于不频繁转换之用。

以cdb为后缀名的文件的用什么打开?

你为什么要打开这种文件呢?这类文件是一种动态链接库文件,看看是不是安装什么软件的时候出现的呢?这是软件运行需要的库文件。

CDB是什么意思

CDB难道不是China Development Bank 国家开发银行么?

社保的cdb是什么文件,怎样打开

模板文件用EDITPLUS、UEDIT打开一般现在都是网上作人员增减和申报,在导入一项中直接点击该cdb文件,就能显示在社保网站上,无需直接点击查看。

网络流行语cdb什么意思

cdb是城市综合体。城市综合体是以建筑群为基础,融合商业零售、商务办公、酒店餐饮、公寓住宅、综合娱乐五大核心功能于一体的“城中之城”。但是随着时代的进步,越来越多源于城市综合体运作模式的综合体建筑不断演化出来,它们的功能比狭义意义上的城市综合体少,根据不同功能的侧重有不同的称号,但是可以都属于城市综合体。城市综合体基本具备了现代城市的全部功能,所以也被称为“城中之城”。大型城市综合体适合经济发达的大都会和经济发达城市,在功能选择上要根据城市经济特点有所侧重,一般来说,酒店功能或者写字楼跟购物中心功能是最基本的组合。

cdb是什么意思???

?对于经常关注商业地产的业内人士来说CDB这个外来词汇并不陌生,而对于不了解商业地产这块的人士来说,到底 CDB是什么意思 呢?下面为大家详细的讲解一下CBD的意思,定义、起源及其基本特征。 CBD的起源 要了解?先了解一下CBD的起源吧, CBD 的概***最早产生于1923年的美国,当时定义为“商业会聚之处”。 随后,CBD的内容不断发展丰富,成为一个城市、一个区域乃至一个国家的经济发展中枢,所以,CBD:中文名称也就是中央商务区,是英文central business district的缩写。其基本定义是,城市中商业和商务活动集中的主要地区。 CBD的基本特征 第一,CBD具有区域中最高的中心性,CBD所提供的所有货物和各种服务具有最高的水准,CBD是各类精华最集中的所在,在CBD所从事的交易和交流都是最高档次的,这里的人群具有一定经济控制的功能 第二,CBD具有最高的可达性。CBD具有城市和区域中最发达的内部交通和外部交通联系,即CBD具有最完善的交通、通信等现代化的基础设施和良好环境,CBD给予办事者以单位时间内最高的办事通达机会。 第三,CBD具有最高的人际和信息交流量,即昼夜人口密度对比度最高,即白天为闹城,夜晚为“鬼城”; 第四,CBD具有最高的土地价格,是城市的黄金地段,其中,商业用地价格通常超出金融、保险等经济性服务和大公司总部、政府各部等管理性服务的用地价格; 第五,CBD具有最高的服务集中性。为了满足高密度人流的流动,所以CBD要集城市经济、科技、文化于一体, 集中了大量的金融、商贸、文化、服务以及大量的商务办公和酒店、公寓等设施。 所以, 呢,CBD不仅是一个国家或地区对外开放程度和经济实力的象征,而且还是现代化国际大都市的一个重要标志。

单细胞转录组双细胞判别软件scDblFinder

起因: 最近有个问题样本,跑完cellranger,样本的cellranger结果如下,细胞数目极高(3W+)。在后续数据质控分析中,线粒体基因占比和双细胞率均很高,用scDblFinder进行双细胞预测,双细胞占率竟然高达34%。我很好奇,双细胞率为什么会这么高,如何审视这个结果?决定看看scDblFinder的细节。 问题1:如何理解Doublets? 在scRNA-seq的细胞捕获步骤中,两个或多个细胞聚集成单个液滴(双联体/多联体)会导致混合的转录组,也就是两个或多个细胞共用一个barcode,称为doublets或multiplets(后面统称为doublets)。它是基于液滴的单细胞测序的技术副产品。双细胞会造成每个“细胞”的高UMI计数,改变cluster的细胞类型鉴定干扰到下游分析。这会导致对稀有细胞类型、中间细胞状态和疾病相关转录组学特征的人为错误发现。双细胞率已被证明与捕获的细胞数量成正比(Bloom 2018; Kang et al. 2018)。 双细胞可以分为同型(相同细胞类型)或异型(不同细胞类型)。 问题2: Cell Ranger可以自动剔除doublets和multiplets吗? 答:目前没有方法可以识别与双细胞中单个细胞相关的转录本信息。 10X官网对双细胞率的 相关答复 ,我们目前没有一种方法通过算法识别单个物种的单细胞基因表达数据,barcode是否包含多个细胞。 目前,Cell Ranger 软件仅在barnyard实验或多物种实验中估计双细胞率。 对此,10X也给出三条参考意见: 他的意思是:1) 通过已知细胞类型的marker基因来鉴别双细胞,比如T/B细胞的marker基因,在同一个barcode细胞中同时高表达就可判定为双细胞;2) seurat标准分析流程,质控环节通过UMI和gene指标过滤;3)运用scDblFinder双细胞预测软件。 问题3:10X Genomics 单细胞实验中估计的双细胞率是多少? 假设不存在细胞结团,可使用下表(取自 10X基因组学用户指南 )来估计单细胞实验中估计的双细胞率。 双细胞率(0.8%/1000cells),如果细胞数为1W,双细胞率为7.6%,约8%。 单细胞实验双细胞率为10-20%,这个数值明显高于上面10X给出的双细胞率(~8%)。这个怎么理解呢? 我想到的几个原因: 1)10X给出的是理想情况的双细胞率(细胞不结团),用标准样本做基准比较; 2)双细胞率跟实验环节中的样本处理和细胞上样量都有关系; 3)还取决如何计算双细胞,双细胞率=双细胞数目/总细胞数;因计算的细胞总体不同而不同; 我们一般会进行QC细胞质控,用UMI/genes指标过滤掉低质量细胞和异常值细胞; 如果QC细胞质控后计算双细胞率,和QC细胞质控前计算双细胞率,预测的双细胞率会不一致; 最近,在网上找到一个10x Genomics 提供的估计双细胞率是: 比如1W个细胞,双细胞率为:0.008*(10000/1000)=0.08=8%。 下面我们看看scDblFinder软件是如何具体执行的。 双细胞在单细胞测序数据中很普遍,可能会导致人为错误的发现。 目前,实验层面还是无法检测同一样本的细胞形成的双细胞,包括异型双细胞。 算法层,已经开发了许多计算方法来根据转录谱识别双细胞。大多数这些方法依赖于通过对真实细胞求和或求平均来生成人造双细胞,并对它们与真实细胞之间的相似性进行评分。 例如,DoubletFinder在真实细胞和人工双细胞的合集上生成k最近邻近图(kNN) ,并估计每个细胞附近人造双细胞的密度(McGinnis, Murrow, and Gartner 2019)。 以类似的方式,Bais和Kostka (2020) 提出的bcds算法和共表达评分cxds算法。 Xi 和 Li (2021a) 最近发表的文章中对双细胞检测方法进行基准测试,使用模拟数据和包含双细胞实验标记的真实数据数据集,发现DoubletFinder的算法最为准确。 但是,基准测试也发现,没有一种方法在所有数据集上都是系统性最优,强调在各种数据集上测试和基准测试方法的必要性,并表明某些算法在不同情况下可能具有优势和劣势。 没有一种算法是完美不缺的,特别是预测模型算法。 下图比较了scDblFinder 这个包中一些方法(以粗体显示)与其他方法: 因此,我们在单细胞转录组数据质控过滤时,会考虑到双细胞的因素,通过相关软件进行预测双细胞。常用的软件有 scDblFinder (R语言)和 Scrublet (python)。这里仅讨论scDblFinder。 安装scDblFinder需要满足R >= 4.0 和 Bioconductor >= 3.12 scDblFinder的输入数据是 SingleCellExperiment 对象(空的drops已经移出),至少要包含counts矩阵(assay ‘counts")。即sce对象都不应该包含空滴,但不应该经过非常严格的过滤(这会影响双细胞率的估计)。 如果还包含归一化矩阵 (assay ‘logcounts") 和PCA (reducedDim ‘PCA"),可以使用scDblFinder的cluster模式(不常见)。 对于 10x 数据,通常将dbr留空是安全的,它会自动估计。 scDblFinder的输出会在sce的colData中添加一些以‘scDblFinder"为前缀的列,其中最重要的是: 如果你有多个样本(理解为不同的细胞捕获),那么最好为每个样本分别进行双细胞识别(对于cell hashes实验中的多重样本,那意味着每个批次)。 可以通过简单地向scDblFinder的samples参数提供样本 id来完成,或者,将样本信息存储在colData列中,提供列名即可。另外,还可以考虑使用BPPARAM参数对其进行多线程处理(假设有足够的RAM)。 例如: 我们用之前案例中的数据测试下scDblFinder函数。 单个样本 该样本共10194个细胞,其中968个细胞被预测为双细胞,双细胞率为9.5% 那么该如何审视这个结果,选择怎样的参数? 我想到的是,对于一个预测模型来说,调参的意义不大,我们对结果没有预判,修改参数,都会出现不同的预测值。另外,对于一个常规的10X单细胞转录组数据,我们对双细胞率是有一定预判的,10X的实验步骤大致固定,cellranger的细胞数大致1W,双细胞率大致10%,我们知道预测的边界。我们有粗略的“标尺”。 但是现在,cellranger给出的细胞数是3W+,我们其实是不清楚双细胞率的边界,细胞数“超纲”了,只知道细胞数越多,双细胞也会越多。这类样本太少,我们没有横向可参考的实例。如果出现这种结果,最应该审视的是实验端出了什么问题,线粒体基因占比也非常高。 scDblFinder有两种生成人造双细胞的主要模式: 随机模式 (scDblFinder.random,clusters=FALSE, 默认方式)和 基于cluster的模式 (scDblFinder.clusters,clusters=TRUE 或提供你自定义的cluster - 以前版本的方法)。在实际中,我们观察到两种方法都表现良好(比其他方法要好)。当数据集被分成清晰的cluster时,教程建议使用基于cluster的方法(例如发展轨迹),否则使用随机模式。 双细胞分为 同型双细胞 ("Homotypic" doublets)和 异性双细胞 ( "Heterotypic" doublets)。同型双细胞由相同类型的细胞(即相似的转录状态)组成,仅根据它们的转录组信息很难辨识。而且,它们对于大多数分析来说也相对无害,因为它们看起来与单细胞高度相似。 相反,异型双细胞(由具有不同转录状态的细胞形成)表现为一种人为的新型细胞类型,会影响下游分析。 scDblFinder只关注异性双细胞。 step1: 将数据集缩减到仅高表达的基因(默认为 1000); 如果使用基于cluster的方法,则会选择每个cluster的表达靠前的基因。另外使用基于cluster的方法(而不是人为指定cluster),将会执行快速聚类(请参阅fastcluster)。 step2: 通过组合不同cluster的细胞来创建人工双细胞,创建的人工双细胞数与cluster的数目成比例。 我们主要关注不同cluster间的双细胞,我们不会试图识别同型双细胞,无论如何,它们实际上无法识别且对下游分析相对无害。因此,我们减少了人工双细胞的必要数量, 也防止分类器被训练以识别与单细胞无法区分的细胞(因此将单细胞称为双细胞)。 scDblFinder另一种策略是生成完全随机的人工双细胞,并使用迭代程序从训练中排除无法识别的人工双细胞。 在实践中,这两种方法具有相当的性能,它们也可以结合使用。 step3: 然后对真实细胞和人工双细胞的合集进行降维,并生成最近邻网络。 接着使用网络来估计每个细胞的许多特征,特别是最近邻居中人工双细胞的比例。 该比率不是选择特定的邻域大小,该比率是在不同的 k 值下计算的,通过使用多个预测变量创建分类器。预测变量还包括距离加权比,进一步添加了的细胞层面上的预测变量:对主成分的预测;文库大小; 和共表达分数(基于Bais 和 Kostka2020 的变体)。 然后 scDblFinder训练梯度提升树( gradient boosted trees ),以根据这些特征区分来自真实细胞的人工双细胞。 最后,阈值程序通过同时最小化错误分类率和预期的双细胞率来决定调用细胞的分数(参见Thresholding)。 step4: 基于分类器方法的一个关键问题是一些真实细胞被错误标记,从某种意义上说,它们实际上是双细胞,但被标记为单细胞。这些会误导分类器。出于这个原因,分类和阈值处理以迭代方式执行:在每一轮中,从下一轮的训练集中删除识别为双细胞的真实细胞。 双细胞只能出现在给定的样本或某次捕获中,因此需要为每个样本单独进行双细胞判别,这也加快了分析速度。如果给定samples参数,scDblFinder将利用该参数将细胞拆分为单个样本/捕获,并在给出BPPARAM参数的情况下并行分析。分类器将在全局范围内进行训练,但阈值将在每个样本的基础上进行优化。如果你的样品是多标签,即不同的样品混合在不同的批次中,那么需要提供批次信息。 通过将数据集减少到仅高表达的基因(由nfeatures参数控制),可以大大加快分析速度,即使会稍微影响到准确度。然后,根据cluster参数,将执行最终的PCA和聚类(使用内部 fastcluster函数)。基于cluster方法的基本原理是同型双细胞几乎不可能根据它们的转录组进行区分,因此创建这种双细胞是一种计算资源的浪费,而且还会误导分类器标记为单细胞。 然而,另一种方法是随机生成双细胞(将clusters设置为 FALSE 或 NULL),并使用迭代方法从训练中排除无法识别的人工双细胞。 根据cluster和propRandom参数,将通过合并随机细胞和/或不相同的cluster对的细胞合并,形成人工双细胞(这可以使用getArtificialDoublets函数手动执行)。 一部分双细胞将简单地使用组成细胞的counts总和,而其余的将进行调整文库大小和进行泊松重采样,数据校正。 对真实细胞和人工细胞的组合执行新的PCA,从中生成 kNN网络。 使用这个 kNN,为每个细胞收集了许多参数,例如 KNN中双细胞的比例、到最近双细胞和最近非双细胞的距离之比等。在输出中报告了一些带有“scDblFinder.”前缀的功能,例如: scDblFinder有相当多的参数来控制预处理、双细胞的生成、分类等(参见?scDblFinder)。 我们仅对重要参数进行说明。 双细胞的期望检出率对邻域中人造双细胞的密度没有影响,但会影响分类器的分数,特别是分类临界值。是通过dbr和dbr.sd参数指定(dbr.sd指定dbr周围的 +/- 范围,在该范围内与dbr的偏差将被视为空)。 对于10x数据,捕获的细胞越多,产生双细胞的概率越大,Chromium文档表明每1000个细胞捕获的双细胞率大约为 1%(因此对于 5000 个细胞,(0.01 5) 5000 = 250 个双细胞) ,scDblFinder默认的预期双细胞率将设置为0.1(默认标准偏差为 0.015)。但是请注意,不同的实验方案可能会产生更多的双细胞率,因此需要相应地更新。如果不确定双细胞率,您可能会考虑增加 dbr.sd,以便大多数/纯粹从错误分类错误中估计它。 那么你很可能有错误的双细胞率。 如果你没有提供dbr参数,双细胞率将使用10X Genomics预期双细胞率自动计算,这意味着捕获的细胞越多,双细胞率就越高。 如果你认为不适用于你的数据,可手动设置dbr。 如果出现意外高的双细胞率最常见原因是,1)你有一个多样本数据集并且没有按样本进行拆分。 scDblFinder会认为数据是具有大量细胞的单次捕获,因此具有非常高的双细胞率。 按样本拆分应该可以解决问题。 阈值根据预期双细胞数量和错误分类(即人造双细胞)试图最小化方差,这意味着有效(即最终)双细胞率将与给定的不同。 scDblFinder还认为假阳性比假阴性对后续的分析问题要小些。你可以通过设置 [dbr.sd=0]在一定程度上减少与输入双细胞率的偏差。 虽然这两种方法在基准测试中的表现非常相似,但随机生成方法在复杂数据集中通常略胜一筹。 如果你的数据被非常清晰地划分为cluster,或者你对双细胞的起源感兴趣,则基于cluster的方法更可取。 这也将能够更准确地计算同型双细胞率,因此略好于阈值法(thresholding)。 否则,特别是如果你的数据没有非常清楚地划分为cluster,则随机方法(例如clusters= FALSE)更可取。 如果你在多样本数据集上运行scDblFinder但是未提供cluster标签,而是基于特定样本的标签(意味着一个样本中的标签“1”可能与另一个样本中的标签“1”无关),并且 在 tSNE上绘制它们看起来没有意义。 出于这个原因,当运行多个样本时,建议首先将所有样本聚集在一起(例如使用 sce$cluster <- fastcluster(sce)),然后将cluster信息提供给 scDblFinder。 如果某些细胞的读数为零(或非常接近于零),则会出现‘Size factors should be positive"此错误。 过滤掉这些细胞后,错误应该消失了。 但是请注意,我们建议在运行 scDblFinder之前不要进行过于严格的过滤。 由于它依赖于人工双细胞的部分随机生成,因此对同一数据多次运行scDblFinder会产生略有不同的结果。你可以使用 set.seed() 确保可重复性,但是在多线程时使用 set.seed() 是不行的。请使用以下程序: 如果输入的sce对象已经包含归一化矩阵( logcounts)或名为“PCA”的reducedDim数据,scDblFinder将使用它们进行聚类分析。 此外,可以使用 scDblFinder() 函数的 cluster参数手动指定。 通过这种方式,seurat聚类可以例如用于创建人造双细胞(参见 ?Seurat::as.SingleCellExperiment.Seurat for conversion to SCE)。 在人造双细胞生成之后,真实和人造双细胞的计数必须一起重新处理(即归一化和 PCA),在内部使用scater执行的。 如果您希望以不同的方式执行此步骤,您可以提供自定义函数来执行此操作(请参阅 ?scDblFinder 中的处理参数)。 然而,我们注意到,这一步的变化对双细胞检测的影响不大。 事实上,例如,根本不执行任何归一化会降低双峰识别的准确性,但也是一点点。 可以,专门处理峰值数据。由于单细胞ATAC-seq数据的稀疏性比转录组要大得多,而且scDblFinder需要处理一系列基因,因此使用默认的标准参数,运行的性能较差(执行慢)。因此,我们推荐使用aggregateFeatures=TRUE,这将在正常的scDblFinder 过程之前聚合相似的基因(而不是选择基因),会产生不错的结果。如果基因足够少,我们推荐直接基于距离计算而不是通过SVD步骤获得,如下所示: cDblFinder的输入数据不应包含空液滴,并且可能需要移除覆盖率非常低的细胞以避免错误(例如 <200 reads)。 进一步的细胞质控应该在双细胞识别的下游进行,有两个理由: 1.默认的预期双细胞率是根据给定的细胞计算的,如果你排除了很多质量低的细胞,scDblFinder可能会认为双细胞率应该低于实际值。 2.剔除所有低质量细胞可能会妨碍我们检测由高质量细胞和低质量细胞组合形成的双细胞的能力。 话虽如此,这些主要是理论依据,除非你的QC过滤非常严格(而且不应该如此!),否则结果不太可能有很大的不同。 scDblFinder运行之前要做一些初次过滤,但不要太严格(例如 <200 UMI) 质控粗略过滤->运行scDblFinder->较严格过滤 后记: 之前在群里看到有人问,双细胞质控后,拿质控后的数据重新跑scDblFinder,还是会有大量双细胞被检出? 这个是必然的,由scDblFinder的算法决定,它是由输入数据建立起预测分类模型,不像singleR有另外一套参考数据集,拿输入数据去map到参考数据集。 只要你喂给scDblFinder数据,它都会给输入的细胞一个score值,然后设置阈值进行分类,值高的为双细胞。 scDblFinder强烈依赖输入数据,有它使用的范畴,所以反复进行双细胞scDblFinder质控,用法是不对的。 拿到单细胞转录组数据,先质控粗略过滤->运行scDblFinder进行双细胞质控->较严格质控过滤。 其实最好有一个相互验证的过程。