首页 OGG错误处理

OGG错误处理

举报
开通vip

OGG错误处理第一章GoldenGate错误分析与处理在维护GoldenGate过程中,由于各种意外情况,难免还是会遇到各种各样的问题。掌握一些常见的GoldenGate故障诊断和错误分析的方法是非常有必要的,而且掌握这些错误分析工具也进一步加深对GoldenGate产品的认识与对GoldenGate原理的理解。1.1GoldenGate常见异常处理GoldenGate运行起来后,随着时间的推移可能会碰到各种各样的问题,下面就来介绍常见的异常现象以及常见的异常处理方法。1.1.1异常处理的一般步骤首先确定是GoldenGate的...

OGG错误处理
第一章GoldenGate错误 分析 定性数据统计分析pdf销售业绩分析模板建筑结构震害分析销售进度分析表京东商城竞争战略分析 与处理在维护GoldenGate过程中,由于各种意外情况,难免还是会遇到各种各样的问题。掌握一些常见的GoldenGate故障诊断和错误分析的方法是非常有必要的,而且掌握这些错误分析工具也进一步加深对GoldenGate产品的认识与对GoldenGate原理的理解。1.1GoldenGate常见异常处理GoldenGate运行起来后,随着时间的推移可能会碰到各种各样的问题,下面就来介绍常见的异常现象以及常见的异常处理方法。1.1.1异常处理的一般步骤首先确定是GoldenGate的哪类进程有故障(是抽取,投递还是复制进程有问题),解决故障的一般思路如下。(1)通过GGSCI>viewreport命令查找ERROR字样,确定错误原因并根据其信息进行排除。(2)通过GGSCI>viewggsevt查看告警日志信息。(3)检查两端数据库是否正常运行,网络是否连通。(4)通过logdump工具对队列文件进行分析。1.1.2RAC单节点失败在RAC环境下,GoldenGate软件安装在共享目录下,可以通过任一个节点连接到共享目录,启动GoldenGate运行界面。如果其中一个节点失败,导致GoldenGate进程中止,可直接切换到另外一个节点继续运行。操作步骤如下。(1)以Oracle用户登录源系统(使用另外一个正常的节点)。(2)确认将GoldenGate安装的所在文件系统装载到另一节点相同目录。(3)确认GoldenGate安装目录属于Oracle用户及其所在组。(4)确认Oracle用户及其所在组对GoldenGate安装目录拥有读写权限。(5)进入GoldenGate安装目录。(6)执行./ggsci进入命令行界面。(7)执行startmgr启动MGR。(8)执行starter*启动所有进程。检查各进程是否正常启动,即可进入正常复制。1.1.3Extract常见异常以下为列举的一些常见错误信息作参考用。Extract进程包括抽取与投递进程,投递进程报错大部分原因是由于网络故障。对于源数据库,抽取进程ext**如果变为abended,则可以通过在GGSCI中使用viewreport命令查看报告,可以通过搜索ERROR快速定位错误。一般情况下,抽取异常的原因是因为其无法找到对应的归档日志,可以通过到归档日志目录命令行下执行示例9-1:ls-ltarchxxxxx.arc查看该日志是否存在,如不存在则可能的原因如下。“日志已经被压缩。“GoldenGate无法自动解压缩,需要人工解压缩后才能读取。“日志已经被删除。如果日志已经被删除,需要进行恢复才能继续复制。一般需要定期备份归档日志,并清除旧的归档日志。需要保证归档日志在归档目录中保留足够长时间之后,才能被备份和清除。即定期备份清除若干小时之前的归档,而不是全部归档。保留时间计算如下。某归档文件保留时间?抽取进程处理完该文件中所有日志所需的时间。可以通过命令行或者GoldenGateDirectorWeb界面,运行infoextxxshowch命令查看抓取进程ext处理到哪条日志序列号。在此序列号之前的归档,都可以被安全的清除。抽取进程在抽取不支持的数据对象时也会abend,report文件会有详细的报错信息,根据report文件来定位错误信息然后再排错即可。下面再单独列出更多的几个故障。Extract:Applicationfaildedtoinitialize(Win)。错误信息:runGGSCIcommandbuttheAlertwindowreport"Applicationfaildedtoinitialize(0xc000026e)"。GoldenGate在Windows平台上需要安装MicrosoftVisualC++2005SP1RedistributablePackageo如果是MicrosoftItanium平台,需要安装vcredist_IA64.exe。Windows2008需以下额外操作:右击'cmd'(DOS),选择'runasadministrator',然后在该命令行窗口中启动MGR和Extract才能够读取数据库日志。将OGG安装为服务时(即运行“installADDSERVICE”),需要使用管理员权限,这样启动服务后即能访问日志。通过以下方法为运行MGR和Extract的用户添加读取日志文件的权限,右键单击文件一>property->security->edit->add。Extract:Cannotloadprogram./ggsci...错误分析:请首先检查该OGGBuild是否与操作系统和数据库相符;其次如果是Aix请检查xLC版本是否符合10.0以上。另外,检查环境变量中动态库路径是否包含了数据库动态库目录,例如:示例9-2:exportLD_LIBRARY_PATH=$ORACLE_HOME/lib不同平台下的环境变量不同。''AIXLIBPATH。''Solaris、Linux等LD_LIBRARY_PATH。''HPUnixSHLIB_PATH。重设环境变量需重启Mgr和Ext/Rep进程。Extract:Blocksizemismatch(8192/512)...裸设备的偏移量各操作系统默认为0但AIX默认为4096。当创建裸设备时使用了-TO选项时,Oracle不会跳过4096字节而是直接从0开始读写。因此在AIX下使用裸设备时,出现此错误需要指定OGG从偏移量0开始读取。示例9-3:tranlogoptionsrawdeviceoffset0该参数其在实际环境中使用几率非常高,在以前版本中如果缺少此参数Extract立即终止,但新版本Extract会持续进行尝试,并不自动终止,需检查报告文件。(4)Extract:ORA-15000ASMconnectionerror该错误为OCI错误, 关于同志近三年现实表现材料材料类招标技术评分表图表与交易pdf视力表打印pdf用图表说话 pdf 示Extract是在连接数据库时出现问题,根据错误信息判断为权限问题。首先在Extract参数中检查ASM相关参数tranlogoptionsasmusersys@+ASMl,asmpasswordoracle,再检查tnsnames.ora和listener.ora验证ASM实例配置是否正确,确认ASM用户具有SYSDBA权限;如果使用SYS,需要将ASM实例的init.ora中REMOTE_LOGIN_PASSWORDFILE参数设置为SHARED(多个数据库可以使用一个password文件,只有SYS用户可以远程登录)。使用sqlplus验证:示例9-4:sqlplussys/oracle@asm1assysdba;//可以登录sqlplussys/oracle@asm1;//报告15000错误(5)Extract:EncounteredSCNThatIsNotGreaterThanTheHighestSCNAlreadyProcessed…原因分析:在OracleRAC环境中,Extract会启动一个coordinator线程对各个节点上的操作进行根据SCN进行排序,它在交易提交后会等待THREADOPTIONSMAXCOMMITPROPAGATIONDELAY参数所定义时间来确认空闲节点没有交易,然后再收集交易数据;写入该交易后如果空闲节点后来又读到了一个SCN号要小的交易,则会报告该错误。可能原因:“各节点之间没有配置时钟同步。“一个节点比另外一个节点慢(IO问题可能性较大)。解决办法:调整Extract参数:示例9-5:THREADOPTIONSMAXCOMMITPROPAGATIONDELAYIOLATENCYMAXCOMMITPROPAGATIONDELAY有效范围是0—90000ms,默认为3s(即3000ms)。GGSV9.x多了一个IOLATENCY参数,可以与上面参数一起加大等待时间。IOLATENCY默认为1.5s,最大值为180000。建议出现该错误后可以将此二参数设置为较大值,然后逐步降低获取最佳设置。需要补充说明的是,出现此错误后,因后面的交易可能已被写入日志,重启Extract可成功启动,但是可能出现如下问题:Extract会重写当前队列覆盖前面的交易数据,后面的DataPump进程可能会出现''abendwithincompatiblerecorderrors”错误终止(旧版本可能出现)。此问题的恢复步骤如下。停止所有DataPump和Replicat,针对所有的Extract记录其WriteCheckpoint的队列Seqno。对于每个Extract向下滚动一个队列:示例9-6:ALTEREXTRACT[name],ETROLLOVER启动Extract查看是否滚动到了下一个队列,记录其新队列seqno,应当是旧队列号+1。修改DataPump从新的队列开始传输:示例9-7:ALTEREXTRACT[pump_name],EXTSEQNO#####EXTRBA0重启DataPump查看是否能够重启成功并从新的队列传输。修改Replicat参数文件,加入或者打开HANDLECOLLISIONS,如果有GROUPTRANSOPS和MAXTRANSOPS请注释掉,启动Replicat,观察其是否能够读取新传输过来的队列如Replicat无法自动滚动到下一个队列,需要通过如下命令手工滚动:示例9-8:alterreplicat[replicat_name],EXTSEQNO#####EXTRBA0等待Replicat处理至U结尾没有延迟时,可以关闭HANDLECOLLISIONS和恢复原来的GROUPTRANSOPS和MAXTRANSOPS参数。重新启动Replicat即可恢复正常复制。网络故障如果MGR进程参数文件里面设置了autorestart参数,GoldenGate可以自动重启,无需人工干预。当网络不稳定或者发生中断时,GoldenGate负责产生远地队列的Pump进程会自动停止。此时,MGR进程会定期根据mgr.prm里面autorestart设置自动启动Pump进程以试探网络是否恢复。在网络恢复后,负责产生远程队列的Pump进程会被重新启动,GoldenGate的检查点机制可以保证进程继续从上次中止复制的日志位置继续复制。需要注意的是,因为源端的抽取进程(Capture)仍然在不断地抓取日志并写入本地队列文件,但是Pump进程不能及时把本地队列搬动到远地,所以本地队列文件无法被自动清除而堆积下来,需要保证足够容量的存储空间来存储堆积的队列文件。计算公式如下。存储容量?单位时间产生的队列大小X网络故障恢复时间MGR定期启动抓取和复制进程参数配置参考:示例9-9:GGSCI>editparammgrport7809autorestarter*,waitminutes3,retries5,RESETMINUTES60每3分钟重试一次,5次重试失败以后等待60分钟,然后重新试三次。1.1.5Replicat进程常见异常对于目标数据库,投递进程repXX如果变为abended,则可以通过在GGSCI中使用viewreport命令查看报告,可以通过搜索ERROR快速定位错误。复制进程的错误通常为目标数据库错误,比如:“数据库临时停机。“目标表空间存储空间不够。“目标表出现不一致。可以根据报告查看错误原因,排除后重新启动rep进程即可。需要注意一点:往往容易忽略UNDO表空间。如果DML语句中包含了大量的UPDATE和DELETE操作,则目标端UNDO的生成速度会很快,有可能填满UNDO表空间。典型错误(数据复制典型错误)如下:示例9-10:一SQLerror1403mapping2010-02-2513:20:08GGSWARNING218OracleGoldenGateDeliveryforOracle,rep_stnd.prm:SQLerror1403mappingHR.MY_EMPLOYEEtoHR.MY_EMPLOYEE.可能原因包括以下几个方面。“两端结构不一致(异构环境,列和主键不同)。“两端有不一致记录。“附加日志不全。可以到discard文件中查看具体错误信息,如果为UPDATE或者DELETE找不到对应记录,并且某几个字段为空,则可认定为缺少了附加日志。1.2使用reperror进行错误处理对于Replicat进程处理DML操作过程中报错时,GoldenGate提供了一个参数用来控制如何处理Replicat进程的报错。这就是本节内容要介绍的reperror参数。这个参数能控制大部分的GoldenGate错误处理的手段。如某 案例 全员育人导师制案例信息技术应用案例心得信息技术教学案例综合实践活动案例我余额宝案例 的Replicat进程参数如图9-1所示。图9-11.2.1reperror处理类型与含义Reperror在GoldenGate11版本中共提供了7类处理错误方式,分别如下。(1)abend:Replicat遇到不能处理的记录时,回滚事务,然后停止处理,Replicat进程状态转为abend。(2)discard:将不能处理记录的错误信息放到discard文件而Replicat进程继续处理下面的记录。(3)exception:将错误按照预先定义好的方式处理。(4)ignore:将不能处理的记录忽略掉,然后继续处理下面的记录。(5)retryop[maxretries]:遇到不能处理的记录时,重试n次。(6)transabort[,maxretries][,delay[c]sesc];终止事务处理,将rba号指到该事务的开头,也可以指定重试几次。(7)reset:清除掉所有的reperror 规则 编码规则下载淘宝规则下载天猫规则下载麻将竞赛规则pdf麻将竞赛规则pdf ,然后将reperror的规则默认为abend。在Replicat进程的参数中,可以将任意一个处理类型设置为默认,如reperror、default、abend。通常,为了保证数据的一致性,都将reperror的默认规则设置为abend。1.2.2复制进程常见数据库错误类型与处理方法在实际的GoldenGate系统中,很大一部分Replicat错误信息都类似于ORA开头的数据库错误(这里以Oracle数据库为例)。虽然,通常对于ORA错误,需要手动查找数据库的原因,但可以用reperror处理一些预知的错误类型,然后再在数据库层面找到错误的原因,手动排除,而不至于导致该进程处理其他正常的表而abend掉。例如:可以忽略掉重复数据的插入而其他类型的报错则abend。示例9-11:Reperror(default,abend)Reperror(-1,ignore)当然,也可以只针对某张表的忽略掉重复数据的插入而abend掉其他类型的报错。示例9-12:REPERROR(-1,IGNORE)MAPsales.product,TARGETsales.product;REPERRORRESETMAPsales.account,TARGETsales.account;最常见的错误为ORA-1403。1403错误是指记录无法投递到目标库,纯属数据错误,要通过查看错误信息和discard文件,到两端库寻找相应记录,结合logdump分析队列中的实际数据,再分析出问题的原因。可能存在的原因有:两端表结构不一致;附加日志错误;初始化方法错误导致不一致;目标端级联删除、trigger没有被禁止;目标端存在Oracle的job或者操作系统任务修改数据。处理方法:“重新初始化该表。“手工修复该条数据。“修改reperror参数为discard或ignore模式,忽略掉错误(在使用这个参数之前用户应该非常清楚自己在做什么,因为它会导致两端数据不一致)。1.3Ddlerror处理DDL复制错误当GoldenGate打开了DDL复制时,当DDL复制报错时,则需要用到此处的ddlerror参数预处理一些常见的报错信息。Ddlerror对于抽取、复制进程均有效,默认为abend。Ddlerror参数的语法为:示例9-13:DDLERROR{|DEFAULT}{〈response〉}[RETRYOPMAXRETRIES[RETRYDELAY]]{INCLUDE〈inclusionclause〉|EXCLUDE〈exclusionclause〉}[IGNOREMISSINGTABLES|ABENDONMISSINGTABLES]如当DDL复制报ORA-1430错误,传递了重复的alter语句导致,则可以用ddlerror(1430,discard)将错误信息扔至Udiscard文件里。其他的错误处理与reperror类似。Discardfile记录进程错误信息用discardfile这个参数来生成一个discard文件,将GoldenGate不能处理的信息记录到这个文件。这样对GoldenGate的troubleshooting非常的有帮助。如源端表结构有变化,默认传递过来的数据应用时Replicat进程则报错,此时则可以通过discard文件看到报错信息位哪个表做了怎样的alter操作,再在目标端也将表结构改变一些,错误即可排除。Discard文件默认在GoldenGate安装目录的dirrpt子文件夹,如图9-2所示。图9-2Discard文件记录的报错信息如图9-3所示。图9-3GoldenGate常见错误分析解决GoldenGate错误的一个关键点就是通过错误分析工具(包括report文件,ggserr.logdiscard文件logdump工具,GGSCI命令行)确定错误的根源是哪个组件引起的。“系统或者网络?“数据库报错或者应用报错?“GoldenGate安装报错?''GoldenGate的某个进程报错?''GoldenGate的参数配置文件报错?'SQL语句或者存储过程报错?然后再确定错误的原因,逐个排查。(2)当GoldenGate遇到错误时,则可以借助日志、report文件找到错误原因,一步一步来排查。一般的错误信息GoldenGate都会提示有相应的解决办法。如下介绍一个错误案例:通过命令:示例9-14:GGSCI>viewggsevt看到的报错信息如图9-4所示。图9-4通过viewreportdpeyb看到的也是类似的信息。再来观察容灾端复制进程的报错信息为:示例9-15:2011-03-0212:03:37ERROROGG-01028Incompatiblerecordin./dirdat/yb018262,rba72955479(gettingheader).通过logdump进入到该trail文件查看,如图9-5所示。图9-5通过分析推敲等,确认是因为trail文件有一条记录已损坏,导致投递进程不识别,不能自动翻滚到下一个trail文件,而复制进程也不能自动应用到下一个trail文件,Pump进程通过手动etrollover,复制进程通过alter手动指定到下一个trail文件应用,故障即可排除。AIXGGSCI无法运行错误信息:示例9-16:CannotloadICUresourcebundle'ggMessage',errorcode2一NosuchfileordirectoryCannotloadICUresourcebundle'ggMessage',errorcode2一NosuchfileordirectoryIOT/Aborttrap(coredumped)或者GGSCI可以启动,但是运行任何命令都报上面的错误。处理方法:通常使用已有的mount点安装GoldenGate,在mount时使用了并发CIO参数。新建文件系统,重新mount,作为GoldenGate安装目录。错误信息:示例9-17:$./ggsciexec():0509-036CannotloadprogramGGSCIbecauseofthefollowingerrors:0509-130SymbolresolutionfailedforGGSCIbecause:0509-136Symbol_GetCatNameFiPCc(number158)isnotexportedfromdependentmodule/usr/lib/libC.a[ansi64.o].0509-136SymbolGetnumpunctFPCc(number162)isnotexportedfromdependentmodule/usr/lib/libC.a[ansi_64.o].0509-136SymbolctQ2_3std8_LocinfoFPCci(number183)isnotexportedfromdependentmodule/usr/lib/libC.a[ansi_64.o].0509-192Examine.loadersectionsymbolswiththe'dump-Tv'command.原因是XLC是6.0版本,升级XLC版本到10.1以上,问题即可解决。1.5.2HP-UXGGSCI无法运行错误信息:coredumped该问题只在HP-UX11.31上发现。处理方法:环境变量没有设置正确。1.5.3队列文件保存天数在mgr.prm中,添加:示例9-29:PURGEOLDEXTRACTS./dirdat/*,usecheckpoints,minkeepdays3修改之后,必须重启manager即可看到队列文件占用的空间被按照上面指定的规则释放。如果存储空间不够,可以将minkeepdays修改为MINKEEPHOURS。如果源端存储空间不足,最好修改最少保留的时间。9.5.12复制进程拆分及指定队列文件及RBA拆分前通过INFOXXX获取队列文件信息及RBA号,返回样例如下:示例9-30:GGSCI>INFOREPYXAREPLICATREPYXALastStarted2011-01-0819:48StatusRUNNINGCheckpointLag00:00:00(updated00:01:42ago)LogReadCheckpointFile./dirdat/p1000556FirstRecordRBA59193235在将Replicat进程拆分后,指定从拆分前的队列文件及RBA号码开始复制:示例9-31:ALTERREPLICATxxxEXTSEQNOnnn,EXTRBAmmm以上面的为例:示例9-32:ALTERREPLICATREPYXA556,EXTRBA591932351.5.4BOUNDEDRECOVERY错误信息:示例9-33:BOUNDEDRECOVERY:resettoinitialoralteredcheckpoint.数据库问题,不能读取第2个节点的archivelog文件。1.5.5排除不复制的表在参数文件中增加:示例9-34:TABLEEXCLUDEschema.table_name1.5.6从指定时间重新抓取重新抓取数据前提:归档文件没有删除。示例9-35:ALTEREXTRACTxxx,TRANLOG,BEGIN2010-12-3108:00时间格式:yyyy-mm-dd[hh:mi:[ss[.cccccc]]]如果是新建:示例9-36:ADDEXTRACTxxx,TRANLOG,BEGIN2010-12-3108:001.5.7进程无法停止通常情况是在处理大交易,尤其在有超过2小时以上的大交易,建议等待进程处理完毕。处理方法:如果必须停止进程,可以强制杀死进程。示例9-37:sendxxxforcestop1.5.8CLOB处理如果包含CLOB字段,在Extract参数文件中必须添加:示例9-38:TRANLOGOPTIONSCONVERTUCS2CLOBS1.5.9DB2不能使用checkpointtable处理方法:在增加Replicat进程时使用nodbcheckpoint参数。示例9-39:addreplicatxxx,exttrail/GoldenGate/dirdat/rb,nodbcheckpoint1.6ogg-错误OGG-00446OGG-00446Couldnotfindarchivedlogforsequence53586thread1underalternativedestinations・错误信息:OGG-00446Couldnotfindarchivedlogforsequence53586thread1underalternativedestinations.SQL.Lastalternativelogtried/arch_cx/1_53586_776148274.arc.,errorretrievingredofilenameforsequence53586,archived=1,use_alternate=0Notabletoestablishinitialpositionforsequence53586,rba44286992.处理办法:将缺失的归档日志从备份中恢复出来。如果依旧找不到所需归档日志,那么只能重新实施数据初始化。今天启动一个extract时,出现以下错误:2011—10—1622:41:02ERROROGG—00446OracleGoldenGateCaptureforOracle,e430rks2.prm:CouldnotfindarchivedlogSQL,sequence10770,archived0Notabletoestablishinitialpositionrba78960656.forsequence10770thread1underdefaultdestinations2011—10—1622:41:02CaptureforOracle,ERROROGG—01668OracleGoldenGatee430rks2.prm:PROCESSABENDING.原因是extract所需的archivedlog已经被清走,不在logarchivedest指定的目录下,解决方法很简单,只要把sequence从10770开始至U当前的archivedlog重新拷贝回logarchivedest目录下即可。第一种办法,会导致数据不一致,改变抽取进程的时间,如下执行:GGSCI(HP—HP)8>alterextractextl,beginnow第二种办法:重新初始化重新初始化过程如下:source库SQL>colcurrent_scnformat999999999999999SQL>Selectcurrentscnfromv$database;CURRENT_SCN12242466771468expdpXPADB/XPADBdirectory=DMPdumpfile=xpadb_20160125_01.dmpLOGFILE=xpadb_20160125.logTABLES=BASE_ACTIONPOWER,BASE_BANKFLASHBACK_SCN=12242466771468target库impdpXPADRPT/xpadrptDIRECTORY=OGGDDUMPFILE=xpadb_20160125_01.dmpLOGFILE=impdp.xpadb_20160125_01.logREMAP_SCHEMA=xpadb:xpadrptREMAP_TABLESPACE=xpaddat:xpaddatatable_exists_action=replacestartreplicatggsrep,aftercsn12242466771468OGG-00446Novalidlogfilesforcurrentredosequencegoldengate从oracleasm中增量同步数据时,出现下述错误.ERROROGG-00446Novalidlogfilesforcurrentredosequence367,thread1,errorretrievingredofilenameforsequence367,archived=0,use_alternate=ONotabletoestablishinitialpositionforbegintime2013-03-2715:32:46.ERROROGG-01668PROCESSABENDING.在抽取进程的参数文件中加入TRANLOGOPTIONSDBLOGREADER即可。参考:ExtractfailduetoanASMconnectionconfigurationissue[ID1061093・1]Appliesto:OracleGoldenGate一Version11.1.1.0.0andlaterInformationinthisdocumentappliestoanyplatform.GoalToshowhowtorecoverfromanextractfailurewhenyourArchiveorRedofilesarestoredunderASMandyouseeoneofthefollowingmessagesERROR118NoValidLogFileForCurrentRedoSequenceXxxx,ThreadYERROR500NovalidlogfilesforcurrentredosequenceX,threadY,errorretrievingredofilenameforsequenceX,archived=0,use_alternate=0NotabletoestablishinitialpositionforbegintimeYYYY-MM-DDHH:MI:SSERROROGG-00446error2(Nosuchfileordirectory)openingredolog.dbfforsequence####NotabletoestablishinitialpositionforbegintimeYYYY-MM-DDHH:MI:SSFixIfyouarerunningOracleASM,theproblemmaybethattheASMconnectioniseithernotdefinedorisincorrectlydefinedorTRANSLOGOPTINSDBLOGREADERneedstobeadded.IfyourarchivefilesareONLYunderASMandextractreceivesanerror500,extractmayhaverunsuccessfullyuntiltheprocessneededtoreadfromtheARCHIVESinsteadoftheREDO.Onceitneedstoreadfromarchive,theextractwillfail.PleaseAddthefollowingline,orcorrectitinyourExtractparameterfile,ifyouareOnOracle11.2.0.2orbetter,or10.2.0.5orbetterandusingOGG11.xTRANLOGOPTIONSDBLOGREADERIftheaboveversionofOracleorOGGdoesn'tapplytoyouspecifyingauserthatcanconnecttotheASMinstanceandrestartyourExtract:TRANLOGOPTIONSASMUSER@,ASMPASSWORDOGG-00446Missingfilenameopeningcheckpointfile.ERROROGG-00446Missingfilenameopeningcheckpointfile.进程RSJQZ011进程abended,如下:ERROROGG-00446Missingfilenameopeningcheckpointfile.检查RSJQZ011配置情况:GGSCI(oraserver.localdomain)19>viewparamRSJQZ011Sourcedefs/goldengate/dirdef/DESJQZ001.defhandlecollisionsbatchsqlSETENV(NLS_LANG=".ZHS16GBK")OBEY/goldengate/dirprm/pwd.obeyDiscardfile/goldengate/dirrpt/RSJZXOOl.dsc,append,megabytes100mapDB_DJGL.A,targetDB_NBGY.A;发现ReplicatRSJQZ011一行被删除了,所以导致报错。力口上ReplicatRSJQZ011后进程启动正常。1.6.2OGG-01154OracleGoldenGateDeliveryforOracle,repn.prm错误信息:OGG-01154OracleGoldenGateDeliveryforOracle,repn.prm:SQLerror1691mappingDATA_USER.DMH_WJXXBtoDATA_USER.DMH_WJXXBOCIErrorORA—01691:unabletoextendlobsegmentDATA_USER.SYS_LOB0000083691C00014$$by16384intablespaceDATA_USER_LOB_U128M_1(status=1691),SQL.处理办法:数据库中该表空间已满,需要对该表空间进行扩容。1.6.2.1OGG-01154错误信息:2011—03—2915:53:57WARNINGOGG—01154OracleGoldenGateDeliveryforOracle,repya.prm:SQLerror14402mappingEPMA.D_METERtoEPMA.D_METEROCIErrorORA-14402:updatingpartitionkeycolumnwouldcauseapartitionchange(status=14402),SQL.导致原因:源端更新了分区列,但目标端没有打开行移动,导致更新时报错;处理方法:SQLPLUS>altertableSCHEMA.TABLENAMEenablerowmovement;1.6.3OGG-00664OGG-00664OCIErrorduringOCIServerAttach(status=12541-ORA-12541:TNS:nolistener)・错误信息:OGG-00664OCIErrorduringOCIServerAttach(status=12541-ORA-12541:TNS:nolistener).处理方法:启动数据库的监听器。OGG-00664OCIErrorduringOCIServerAttach(status=12545-ErrorwhiletryingtoretrievetextforerrorORA-12545)・2015—06—0922:31:11ERROROGG—00664OCIErrorduringOCIServerAttach(status=12545-ErrorwhiletryingtoretrievetextforerrorORA-12545).2015-06-0922:31:16ERROROGG-01668PROCESSABENDING.ORACLE_HOME设置有问题。解决办法:setenv(ORACLE_HOME=/u01/app/oracle/product/11.2.0/dbhome_1)1.6.4OGG-006651.6.4.1OGG-00665OCIErrordescribeforquery(status=3135-ORA-03135:connectionlostcontact错误信息:OGG-00665OCIErrordescribeforquery(status3135-ORA-03135:connectionlostcontactProcessID:8859SessionID:131Serialnumber:31),SQL.处理方法:在没有关闭OGG进程的情况下,提前关闭了数据库,导致OGG进程出现异常。如果是发现了这个错误提示,应该马上关闭OGG进程,注意数据库的归档日志情况,保证归档日志不会缺失,然后等待数据库启动成功后,马上启动OGG进程。6.4.20GG-00665OCIErrordescribeforqueryAppliesto:OracleGoldenGate-Version:11.1.1.0.7andlater[Release:1.1andlater]Informationinthisdocumentappliestoanyplatform.SymptomsWhenattemptingtostartanExtract,wegeterror2010-12-0918:59:25GGSERROR182OCIErrordescribeforquery(badsyntax)(status=942-ORA-00942:tableorviewdoesnotexist),SQL.2010-12-0918:59:25GGSERROR190PROCESSABENDING.CauseThedatabaseuserdoesnothavethenecessaryprivilege.SolutionGrantthenecessaryprivilegetotheGoldenGateuser.SQL>grantselectonsys.props$toggsuser;orSQL>grantselectanydictionarytoggsuser;OGG-00665OCIErrordescribeforquery(status=942-ORA-00942:tableorviewdoesnotexist),SQXSELECT1FROMDUALWHEREEXISTS(SELECT'x'FROMggusr・GGS_pDL_HISTWHEREOPTIME<'2015-05-2511:12:43')>・2015—06—0812:12:43ERROROGG-00665OCIErrordescribeforquery(status=942—ORA—00942:tableorviewdoesnotexist),SQL.2015—06—0812:12:43ERROROGG—01668PROCESSABENDING.如果想使用DDL功能,需要在之前运行支持DDL的相关脚本。@marker_setup.sql@ddl_setup.sqlmodeofinstallation:initialsetup@role_setup.sqlGRANTGGS_GGSUSER_ROLETOgguser@ddlenable.sqlOGG-01161Badcolumnindex(4)specifiedfortableQQQ・TIANSHI,maxcolumns=4・错误信息:OGG-01161Badcolumnindex(4)specifiedfortableQQQ.TIANSHI,maxcolumns=4.处理方法:对照一下生产端与容灾端的这一张表的表结构,如果容灾端的表缺少一列,则在容灾端,登陆数据库,增加这一列,然后启动复制进程。OGG-00199TableQQQ.T0417doesnotexistintargetdatabase.错误信息:ERROROGG-00199TableQQQ.T0417doesnotexistintargetdatabase.处理方法:查看源端抽取进程的参数,DDL复制参数是否配置,针对这张表,重新实施数据初始化。OGG-01738BOUNDEDRECOVERYdatabaseversion:11.2.0.3RACgoldengateversion:11.1.1.1.2早上发现数据同步异常,source端状态如下:GGSCI(ulecardrac1)3>infoallProgramnceChkptStatusGroupLagTimeSiMANAGERRUNNINGEXTRACTRUNNINGEXT23200:00:0006:32:33EXTRACTRUNNINGPUMP23200:00:0000:00:03status还是为RUNNING,但是已经有六个半小时没有update了,其实该进程已经hang住查看告警日志ggserr.log发现存在OGG-01738提示2013—03—0702:42:28INFOOGG-01738OracleGoldenGateCaptureforOracle,ext232.prm:BOUNDEDRECOVERY:CHECKPOINT:forobjectpool1:p5905_RedoThread1:start=SeqNo:679,RBA:83280912,SCN:1.913813052(5208780348),Timestamp:2013—03—0622:00:20.000000,end=SeqNo:679,RBA:129051136,SCN:1.938808049(5233775345),Timestamp:2013-03-0702:42:03.000000.2013-03-0702:42:28INFOOGG-01738OracleGoldenGateCaptureforOracle,ext232.prm:BOUNDEDRECOVERY:CHECKPOINT:forobjectpool2:p5905RedoThread2:start=SeqNo:692,RBA:103611920,SCN:1.913812238(5208779534),Timestamp:2013-03-0622:00:16.000000,end=SeqNo:693,RBA:93604864,SCN:1.938808100(5233775396),Timestamp:2013-03-0702:42:15.000000.MOS上有一篇关于该错误的文章note1293772.1国内大牛刘相兵的博客上也有一篇关于该错误的说明:HYPERLINK"http://www.askmaclean.com/archives/ogg-01738-bounded-reco"http://www.askmaclean.com/archives/ogg-01738-bounded-recovery.htmlThesolutionistoresettheBoundedRecoveryCheckpointfilewhenrestartingtheextractlike:GGSCI>startBRRESET因为extract进程ext232已经假死,无法stop掉,甚至用'sendext232forcestop'和'stopmgr'也无法stop掉该extract进程最后只能在shell下kill掉进程,再重新执行GGSCI>startext232BRRESET重新启动后,发现状态已经正常,同步已经基本无延迟。该bug只在RAC中或者单实例设置了多个thread的情况下出现,而且在更高级版本中已经修复,为了一劳永逸,可以考虑将ogg升级至11.2.1.0.12012-10-2010:28:02INFOOGG-01738BOUNDEDRECOVERY:CHECKPOINT:forobjectpool1:p17448_extr:start=SeqNo:343,RBA:79286800,SCN:0.3712874(3712874),Timestamp:2012-10-1922:27:45.000000,Thread:1,end=SeqNo:343,RBA:79287296,SCN:0.3712874(3712874),Timestamp:2012-10-1922:27:45.000000,Thread:1.2012-10-2014:28:05INFOOGG-01738BOUNDEDRECOVERY:CHECKPOINT:forobjectpool1:p17448_extr:start=SeqNo:343,RBA:107000336,SCN:0.3725744(3725744),Timestamp:2012-10-2002:27:14.000000,Thread:1,end=SeqNo:343,RBA:107000832,SCN:0.3725744(3725744),Timestamp:2012-10-2002:27:14.000000,Thread:1.2012-10-2018:28:06INFOOGG-01738BOUNDEDRECOVERY:CHECKPOINT:forobjectpool1:p17448_extr:start=SeqNo:343,RBA:128054288,SCN:0.3739371(3739371),Timestamp:2012-10-2006:28:02.000000,Thread:1,end=SeqNo:343,RBA:128054784,SCN:0.3739371(3739371),Timestamp:2012-10-2006:28:02.000000,Thread:1.CHECKPOINT:forobjectpool1:p17448extr:start=SeqNo:343,RBA:153368080,SCN:0.3752583(3752583),Timestamp:2012—10—2010:27:46.000000,Thread:1,end=SeqNo:343,RBA:153368576,SCN:0.3752583(3752583),Timestamp:2012—10—2022:28:06INFOOGG—01738BOUNDEDRECOVERY:2012—10—2010:27:46.00
本文档为【OGG错误处理】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: ¥21.0 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
青青子衿
暂无简介~
格式:doc
大小:127KB
软件:Word
页数:104
分类:高中语文
上传时间:2022-08-05
浏览量:26