mysql故障怎么解决,mysql常见故障

怎么解决mysql服务无法启动的问题

1、情况一：MySQL的错误日志文件（安装目录\MYOA\data5\机器名.err）会记录如下内容：

创新互联公司主要从事网站建设、网站设计、网页设计、企业做网站、公司建网站等业务。立足成都服务太原,10年网站建设经验,价格优惠、服务专业,欢迎来电咨询建站服务:028-86922220

InnoDB: Reading tablespace information from the .ibd files...

InnoDB: Error: trying to add tablespace 460 of name '.\td_oa\flow_data_35.ibd'

InnoDB: to the tablespace memory cache, but tablespace

InnoDB: 460 of name '.\td_oa\exam_data.ibd' already exists in the tablespace

解决方法：

1）剪切出安装目录\MYOA\data5\TD_OA的flow_data_35.ibd和flow_data_35.frm两个文件；

2）启动MySQL5_OA服务，使用备份的flow_data_35.sql导入到TD_OA库中。如果提示flow_data_35表已经存在不能导入，则继续按后续步骤执行；

3）在data5下手动建立tmp目录；

4）使用MySQL管理工具或MySQL命令行程序在tmp下建立名称为flow_data_35的表（包含一个字段即可）；

5）将tmp下的flow_data_35.frm和flow_data_35.ibd拷贝到安装目录\MYOA\data5\TD_OA目录下；

6）在MySQL管理工具或MySQL命令行程序中，进入TD_OA库，使用“drop table flow_data_35;”命令清除公共表空间中残留的flow_data_35表的相关信息；

7）进入tmp库，删掉flow_data_35表；

8）使用备份的flow_data_35.sql导入到TD_OA库中；

9）如果还有其他表存在该问题，可重复执行4至8步骤。

2、情况二：MySQL的错误日志文件（安装目录\MYOA\data5\机器名.err）会记录如下内容：

130409 15:54:31 [Note] Plugin 'FEDERATED' is disabled.

130409 15:54:31 InnoDB: The InnoDB memory heap is disabled

130409 15:54:31 InnoDB: Mutexes and rw_locks use Windows interlocked functions

130409 15:54:31 InnoDB: Compressed tables use zlib 1.2.3

130409 15:54:32 InnoDB: Initializing buffer pool, size = 1023.0M

InnoDB: VirtualAlloc(1086849024 bytes) failed; Windows error 8

130409 15:54:32 InnoDB: Completed initialization of buffer pool

130409 15:54:32 InnoDB: Fatal error: cannot allocate memory for the buffer pool

130409 15:54:32 [ERROR] Plugin 'InnoDB' init function returned error.

130409 15:54:32 [ERROR] Plugin 'InnoDB' registration as a STORAGE ENGINE failed.

130409 15:54:32 [ERROR] Unknown/unsupported storage engine: Innodb

130409 15:54:32 [ERROR] Aborting

解决方法：

此情况出现的原因是myoa\mysql5\my.ini中innodb_buffer_pool_size的值太大，OA服务器操作系统不支持所致。改小后再启动mysql5_OA服务即可，一般保持和数据库大小一致。数据库大小即是myoa/data5的大小。

3、情况三：mysql服务启动不了，事件查看器中显示：The syntax '--log-slow-queries' is deprecated and will be removed in a future release. Please use '--slow-query-log'/'--slow-query-log-file' instead.

解决方法：安装目录\MYOA\data5下的ibdata1、ib_logfile0、ib_logfile1文件属性被设置为只读导致，取消只读控制，重启mysql5_OA服务即可。

4、情况四：MySQL的错误日志文件（data5\机器名.err）会记录如下内容：InnoDB: No valid checkpoint found.

解决方法：此问题找不到检查点，数据库是无效的，此种情况，只能用热备份数据恢复。

5、以上四种情况，是2013版OA系统目前比较常见的mysql服务启动不了的现象和解决办法，大家可作参考，其他情况的话，再具体分析处理。

6、分析思路总结：遇到mysql5_OA服务启动不了的情况，首先查看myoa\data5下的错误日志文件，根据日志中的具体内容进行具体分析。

7、2013版MYSQL服务启动不了（可以尝试强制启动mysql服务）方法如下：

1)打开\MYOA\mysql5\my.ini，去掉innodb_force_recovery=1前边的注释。

2)启动MySQL5_OA服务，此时MySQL处于只读状态，可以导出，不可写入。如果仍不能启动，可以尝试将innodb_force_recovery修改为2、3、4、5、6等，直到可以启动为止。

3)使用MySQL管理工具，将TD_OA等相关的数据库导出为SQL文件。

4)停止MySQL5_OA服务，删除TD_OA下的所有文件、ibdata1、ib_logfile0、ib_logfile1等文件。

5）打开\MYOA\mysql5\my.ini，在innodb_force_recovery=1前边加上#号，将该项注释掉。

6)启动MySQL5_OA服务，然后导入此前备份的SQL文件。

7)检查数据库，将无法通过该方法恢复的数据表，通过之前自动备份的SQL文件进行恢复。

MySQL之MGR成员故障导致整个集群不可用的问题排查分析

2020-08-14

集群有三个成员memberA、B、C成，其中memberB意外故障停掉了，然后memberA 执行stop group_replication退去集群.此时整个集群不可用了（不能更新数据）。

集群中唯一剩余的成员memberC上看到的成员状态为：

但是memberA看到的状态为：

查看最后的存活的memberC的错误日志发现：

"Plugin group_replication reported: 'This server is not able to reach a majority of members in the group. This server will now block all updates. The server will remain blocked until contact with the majority is restored. It is possible to use group_replication_force_members to force a new group membership.' "

大概意思是当前的服务没法获取到成员的投票数，当前服务将会阻塞所有的更新，直到能够获取到投票数。可以使用group_replication_force_members 来强制组成一个新的组。

开始认为这是MGR功能的一个bug，不过后来想想这样的设定也是合理的，因为如果是当前的服务成员自身网络或其他问题导致的无法与其他成员的通信成功，那么这样的情况下这种设定也是合理的，因为不能让它自动重新组成一个组，否则就会可能出现多个重复的组。对于为什么组成员A执行stop group_replication后，剩余的memberC的视图中memberA还是online状态，可能是因为memberB已经unreachable,所以memberC去请求是否同意memberA退去时没有得到结果，一直阻塞等待造成的。此时，memberA的退出结果应该是无法多数投票通过的，因此memberA的退出结果应该是失败的。查看memberA的error日志，结果确实如此：

解决的方法是memberC也执行stop group_replication停掉这个组，再重新组成一个新的组。

此时memberA再重新加入就成功了：

结果：

以此类推，当有多个server组成的group而有多数成员已经意外故障时，导致整个组的停止更新，目前想到的解决的方法就是停掉现在的组，重新组成新的组。

ps:

增加Group Replication System Variables中group_replication_member_expel_timeout的大小，可以避免网络问题或执行事务慢造成的错误驱逐。

技术分享 | MySQL 启动失败的常见原因

MySQL 启动失败的最常见的原因有两类，分别是无法访问系统资源和参数设置错误造成的，下面分别分析如下。

MySQL 不能访问启动需要的资源是造成而 MySQL 无法启动的一个常见原因，如：文件，端口等。由于 linux 中用于启动 mysqld 进程的 mysql 用户通常是不能登陆的，可以使用类似下面的命令检查文件的访问权限。

找出问题后，修改对应文件或目录的权限或属主后通常可以解决问题。但有时 mysql 用户有访问文件和目录的权限，但仍然会被拒绝访问，例如下面这个例子：

测试说明 mysql 用户有这个目录的访问权限，但创建文件还是失败，这种情况让很多人困惑，这个时候通常是 mysqld 进程的访问被 linux 的 selinux 或 apparmor 给阻止了，大家可以看到创建的表不是在 mysql 的默认目录下面，因此 selinux 或 apparmor 的 policy 里面没有包含这个目录的访问权限，此时只要对应的修改 policy 就行了，当然把 selinux 或 apparmor 停了也行。

有时虽然对系统资源有访问的权限，但系统资源已经被占用：

这个故障产生的原因是另外一个 mysqld 进程已经启动并占用了对应的文件。

参数设置错误造成 MySQL 无法启动的原因也非常常见，此时先要检查 MySQL 启动时会调用的参数，下面的命令可以查询 MySQL 启动时调用参数文件的顺序：

知道了 MySQL 参数文件的调用顺序，我们就可以检查对应的参数文件，找出其中的错误，如果觉得参数文件的可读性不强，可以使用下面的命令显示 mysqld 程序将要调用的参数：

注意这个命令显示完参数后就退出，不会真正运行 mysqld。这个命令和 my_print_defaults mysqld 完全是等价的，只不过后者的显示方式是一行一个参数。

然后开始对可疑的参数进行调试，我个人喜欢加的参数和顺序如下：

看这个例子：

看这个例子，我们很容易知道是需要我们同时设置参数 GTID_MODE 和 ENFORCE_GTID_CONSISTENCY 同时为 on 才行。

MAC OS 下坑爹的Mysql故障

准备在本地搭建一个完整的平台，在本地调试可能比较方便些，我可以做些定制化的修改。结果发现，本地搭建环境会有很多坑爹的问题，各种坑，一路需要摸索着来。

我抱着绝对顺利的心，启动服务程序，结果发现，坑爹，根本启动不了，完全懵逼不清楚情况。

以前明明可以用，现在居然启动失败了，我擦。二脸懵逼，咋整呢？想了两个方案，一个是在vm虚拟机下面搭建一个新的环境，第二个是在本地重新装mysql，这样速度最快，我也可以省事，毕竟时间挺重要的。

对于一个对技术有执着有想法的人，明显这两个方案都不靠谱，辣么，只有自己研究看怎么解决问题了。首先，我翻看了下mysql错误日志，默认情况下在:

当然，这是我的默认路径，对于你们自己的我就不清楚了。翻看的时候发现有一些提示，具体如下：

抓住最后一个tips，去搜索下了，发现有很多说法，在gg上找到不少的结局方式，基本都不好使。诸如以下：

坑爹啊。。。后来朋友说了一句，会不会是权限啊？我就纳闷了，试了一下，居然狗日的成功了。。。

碰到问题不要先重装，或许你这次重装后，下次还会遇到类似的问题，到那个时候就真心悲剧了。最好的办法就是手动尝试解决下，说不定会有更好的结果。

mysql数据库崩溃的原因？

MySQL 在崩溃恢复时，会遍历打开所有 ibd 文件的 header page 验证数据字典的准确性，如果 MySQL 中包含了大量表，这个校验过程就会比较耗时。 MySQL 下崩溃恢复确实和表数量有关，表总数越大，崩溃恢复时间越长。另外磁盘 IOPS 也会影响崩溃恢复时间，像这里开发库的 HDD IOPS 较低，因此面对大量的表空间，校验速度就非常缓慢。另外一个发现，MySQL 8 下正常启用时居然也会进行表空间校验，而故障恢复时则会额外再进行一次表空间校验，等于校验了 2 遍。不过 MySQL 8.0 里多了一个特性，即表数量超过 5W 时，会启用多线程扫描，加快表空间校验过程。

如何跳过校验MySQL 5.7 下有方法可以跳过崩溃恢复时的表空间校验过程嘛？查阅了资料，方法主要有两种：

1. 配置 innodb_force_recovery可以使 srv_force_recovery != 0 ，那么 validate = false，即可以跳过表空间校验。实际测试的时候设置 innodb_force_recovery =1，也就是强制恢复跳过坏页，就可以跳过校验，然后重启就是正常启动了。通过这种临时方式可以避免崩溃恢复后非常耗时的表空间校验过程，快速启动 MySQL，个人目前暂时未发现有什么隐患。2. 使用共享表空间替代独立表空间这样就不需要打开 N 个 ibd 文件了，只需要打开一个 ibdata 文件即可，大大节省了校验时间。自从听了姜老师讲过使用共享表空间替代独立表空间解决 drop 大表时性能抖动的原理后，感觉共享表空间在很多业务环境下，反而更有优势。

临时冒出另外一种解决想法，即用 GDB 调试崩溃恢复，通过临时修改 validate 变量值让 MySQL 跳过表空间验证过程，然后让 MySQL 正常关闭，重新启动就可以正常启动了。但是实际测试发现，如果以 debug 模式运行，确实可以临时修改 validate 变量，跳过表空间验证过程，但是 debug 模式下代码运行效率大打折扣，反而耗时更长。而以非 debug 模式运行，则无法修改 validate 变量，想法破灭。

当前题目：mysql故障怎么解决,mysql常见故障
当前链接：http://6mz.cn/article/phepej.html